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内 容 简介 


目 计 算 机 与 软件 出 现 以 来 ， 在 近 半 个 世纪 里 ， 软 件 开 发 所 能 衍生 
出 的 无 限 创意 ， 深 深 吸引 着 全 世界 的 青年 。 在 二 进 制 的 世界 里 ， 这 帮 
年 轻 的 程序 员 充 分 发 挥 目 己 的 热情 和 想象 力 ， 仅 仅 通过 对 “1” 和 “0” 的 
互 换 操作 ， 他 们 辟 地 开 天 ， 瓷 意 汪 洋 地 创造 出 一 个 又 一 个 的 奇迹 。 今 
天 ， 前 几 代 “青年 ”积累 构建 的 虚拟 世界 正在 深刻 地 改变 我 们 的 现实 生 
活 。 软 件 开发 过 程 的 复杂 程度 已 经 足以 媲美 传统 的 工业 生产 。 前 人 堆 
积 如 山 的 开发 经 验 和 规则 ， 令 象牙 塔 里 的 学 子 们 望而生畏。 今天 软件 
学 院 的 学 生 们 站 在 巨人 的 肩膀 上 ， 用 最 流行 的 语言 和 工具 武装 到 了 牙 
齿 ， 但 似乎 缺少 了 前 春 们 的 热情 ， 也 志 记 了 编程 的 乐趣 所 在 一 一 发 现 
问题 ， 分 析 问 题 ， 解 决 问题 ， 寻 找 更 优 的 解法 ， 总 结 规律 ， 抽 象 出 算 
法 的 过 程 ， 以 及 由 此 产生 的 成 就 感 。 


本 书 收集 了 大 约 60 道 微软 技术 面试 题 ， 作 者 试图 通过 书 中 妙趣 横 
生 的 问题 和 详细 的 解说 ， 面 试 者 的 各 种 小 故事 ， 告 诉 读者 微软 需要 什 
么 样 的 技术 人 才 ， 重 视 什 么 样 的 能 力 ， 如 何 甄别 人才 。 但 它 更 深层 的 
意义 在 于 引导 读者 思考 ， 帮 助 读 者 重 拾 通 过 编程 探索 未 知 世 界 的 乐 
趣 。 


未 经 许可 ， 不 得 以 任何 方式 复制 或 抄袭 本 书 的 任何 部 分 。 
版 权 所 有 ， 侵 权 必 究 。 
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联系 博文 视 所 


您 可 以 通过 如 下 方式 与 本 书 的 出 版 方 取得 联系 。 

读者 信箱 : reader@broadview.com.cn 

投稿 信箱 : bvtougao@gmail.com 

北京 博文 视点 资讯 有 限 公司 (武汉 分 部 ) 
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若 您 希望 参加 博文 视点 的 有 奖 读 者 调查 ， 或 对 写作 和 翻译 感 兴趣 ， 欢 
迎 您 访问 : http://bv.csdn.net 

关于 本 书 的 勘误 、 资 源 下 载 及 博文 视点 的 最 新 书 讯 ， 欢 迎 您 访问 博文 
视点 官方 博客 : http://blog.csdn.net/bvbook 


推荐 序 


我 在 卡 内 基 梅 隆 大 学 毕业 找 工 作 的 时 候 ， 经 常 和 其 他 同学 一 起 交 
流 面试 的 经 验 。 当 时 令 求职 者 “ 闻 面 色 变 ” 的 公司 有 微软 ， 研 究 所 有 
DEC 的 SRC。 每 次 有 同学 去 微软 或 SRC 面 试 ， 回 来 的 时 候 都 会 被 其 他 
同学 追问 有 没有 什么 有 趣 的 面试 题 。 我 也 是 那 时 第 一 次 听 说 “下 水 道 井 
盖 为 什么 是 圆 的 ”这 一 问题 。 

我 自己 申请 加 入 微软 美国 研究 院 时 被 面试 了 两 天 ， 见 了 15 个 人 ， 
感觉 压力 很 大 。 至 今 还 记得 有 一 位 面试 者 不 断奶 问 我 论文 中 一 个 算法 


也 面试 了 非常 多 的 新 员工 。 特 别 在 微软 亚洲 研究 院 的 九 年 ， 经 常 感觉 
很 多 刚刚 毕业 的 优秀 学 生 基础 很 好 ， 但 面试 的 准备 不 足 。 我 非常 欣慰 
地 看 到 邹 欣 工程 师 和 微软 亚洲 研究 院 其 他 同事 们 努力 编写 了 这 本 好 
书 ， 和 大 家 一 起 分 享 微 软 的 面试 心得 和 编程 技巧 。 相 信和 更 多 的 同学 会 
因此 成 为 “ 笔 霸 ”“ 面 霸 "， 甚 至 “offer 霸 ”。 

程序 虽然 很 难 写 ， 却 很 美妙 。 要 想 把 程序 写 好 ， 需 要 学 好 一 定 的 
基础 知识 ， 包 括 编程 语言 、 数 据 结构 和 算法 。 程 序 写 得 好 的 人 通 单 都 
有 绩 密 的 逻辑 思维 能 力 和 良好 的 数理 基础 ， 而 且 熟 悉 编 程 环境 和 编程 
工具 。 古 人 说 “ 见 文 如 见 人 ”， 我 觉得 程序 同样 也 能 反映 出 一 个 人 的 功 
力 和 风格 ， 好 的 程序 读 来 非常 赏心悦目 。 我 以 前 常 出 的 一 道 面 试题 是 
“展示 一 段 自己 觉得 写 过 的 最 好 的 程序 ”。 

编程 很 艰苦 ， 但 是 很 有 趣 。 本 书 的 作者 们 从 游戏 中 遇 到 的 编程 问 
题 谈 起 ， 介 绍 了 数字 和 字符 串 中 的 很 多 技巧 ， 探 索 了 数据 结构 的 究 
门 ， 还 发 握 了 数学 游戏 的 乐趣 。 我 希望 读者 在 阅读 本 书 时 能 找到 编程 
的 快乐 ， 欣 赏 到 编程 之 美 。 本 书 适 合计 算 机 学 院 、 软 件 学 院 、 信 息 学 
院 高 年 级 本 科 生 、 研 究 生 作为 软件 开发 的 参考 教材 ， 也 是 程序 员 继 续 


进修 的 优秀 阅读 材料 ， 更 是 每 位 申请 微软 公司 和 其 他 公司 软件 工程 师 
之 职 的 面试 必 读 秘 必 。 
人 类 的 生活 因为 优秀 的 程序 员 和 美妙 的 程序 而 变 得 更 加 美好 。 


帝 问 洋 
微软 公司 杰出 工程 师 


微软 公司 全 球 资深 避 总 坟 
2008 年 春节 于 香港 


序 


一 位 应 聘 者 (interviewee) 在 我 面前 写 下 了 这 样 的 几 行 程序 : 

while {true) 1 

然后 就 陷入 了 沉思 ， 恨 久 ， 她 问 道 :“ 那 else 怎么 办 ? 怎么 能 让 电 
脑 不 做 事情 呢 ? ” 

我 说 :“ 对 呀 ， 怎 么 才能 让 电脑 闲 下 来 ”你 平时 上 课 、 玩 电脑 的 时 
候 有 没有 想 过 ? 这 样 吧 ， 你 可 以 上 网 查 查 资料 。” 

她 很 快 地 在 搜索 引擎 中 输入 “50%CPU 占 用 率 ” 等 关键 字 ， 但 是 搜 
索 并 没有 返回 什么 有 用 的 结果 。 

在 她 忙 着 搜索 的 时 候 ， 我 义 看 了 一 遍 她 的 简历 ， 从 简历 上 可 以 看 
到 她 的 成 绩 不 错 ， 她 学 习 了 很 多 程序 设计 语言 ， 也 研究 过 “设计 模 
式 ”、“ 架 构 ”、“SOA”* 等 ， 她 对 Windows、Linux 也 很 熟悉 。 我 的 面试 问 
题 是 :“ 如 何 写 一 个 短小 的 程序 ， 让 Windows 的 任务 管理 器 显示 CPU 的 
占用 率 为 50%? ”这 位 应 聘 者 尝试 了 一 些 方法 ， 但 是 始终 没有 写 出 一 个 
完整 的 程序 。 面 试 的 时 间 到 了 ， 她 看 起 来 比较 遗憾 ， 我 也 一 样 ， 因 为 
我 还 有 一 系列 的 后 续 问 题 没 有 机 会 问 她 : 

如 何 能 通过 命令 行 参数 ， 让 CPU 的 使 用 率 保 持 在 任意 位 置 ， 如 
90%? 

如 何 能 让 CPU 的 使 用 率 表现 为 一 条 正弦 曲线 ? 

如 果 你 的 电脑 是 双核 (dual-core CPU) 的 ， 那 么 你 的 程序 会 有 
什么 样 的 结果 ? 为 什么 ? 

自从 2005 年 回 到 微软 亚洲 研究 院 后 ， 我 面试 过 不 少 应 聘 者 ， 作 为 
面试 者 ， 我 最 希望 看 到 应 聘 者 给 出 独具匠心 的 回答 ， 这 样 我 也 能 从 中 
学 到 一 些 “ 妙 招 ”。 遗 憾 的 是 看 到 “妙招 ”的 时 候 并 不 多 。 


我 也 为 微软 校园 招聘 出 过 考题 ， 走 访 过 不 少 软 件 学 院 ， 还 为 员工 
和 实习 生 做 过 培训 。 我 了 解 到 不 少 同学 认为 软件 开发 的 工作 没意思 ， 
是 “TT 民工 "”、“ 软 件 赣 领 "。 我 和 其 他 同事 也 听 到 一 些 抱 怨 ， 说 一 些 高 
校 计算 机 科学 的 教育 只 停留 在 原理 上 ， 和 忽视 了 对 原理 和 技术 的 理解 和 
运用 。 

写 程 序 真 的 没有 意思 吗 ? 为 什么 许多 微软 的 员工 和 软件 业界 的 牛 
人 乐此不疲 ? 我 和 一 些 喜 欢 编程 的 同事 和 实习 生 创作 编写 了 这 本 书 ， 
我 们 希望 通过 分 析 微 软 面试 中 经 常 出 现 的 题目 ， 来 展示 编程 的 乐趣 。 
编程 的 乐趣 在 于 探索 ， 而 不 是 在 于 背 答案 。 面 试 的 过 程 就 是 展现 分 析 
能 力 、 探 索 能 力 的 过 程 ， 在 面试 中 展现 出 来 的 巧妙 的 思路 、 简 明 的 算 
法 、 严 说 的 数学 分 析 就 是 我 们 这 本 书 要 谈 的 “编程 之 美 "。 

有 时 候 会 有 同学 问 :“ 你 们 是 不 是 有 面试 题库 ? ” 言 下 之 意 是 每 个 
应 聘 者 都 是 从 * 库 ?中 随机 抽出 一 道 题目 ， 如 果 答 对 了 ， 就 中 了 ; 如 果 
答 错 了 ， 融 bye-bye 了 。 书 中 有 一 些 关 于 面试 的 问答 ， 我 想 它们 可 以 回 
答 这 样 一 些 疑 惑 。 

本 书 的 题目 ， 一 部 分 源 自 各 位 作者 平时 想 出 来 的 ， 例 如 ， 有 一 次 
一 位 应 聘 者 滔滔 不 绝地 讲述 自己 如 何在 某 大 型 项 目 中 进行 CPU 的 压力 
测试 ， 听 上 去 水 分 不 少 ， 我 一 边 听 一 边 琢磨 "怎样 才能 考察 一 个 人 是 否 
真正 懂 了 CPU， 任 务 调度 .…...”， 后 来 就 有 了 上 面 提 到 的 “CPU 使 用 率 ” 
的 面试 题 。 有 些 题目 来 自 于 平时 的 实践 和 和 讨论， 比如 一 些 和 游戏 相关 
的 题目 。 有 些 题目 是 随手 拓 来 ， 比 如 我 看 到 朋友 的 博客 上 有 一 道 面试 
题 ， 自己 做 了 一 下 ， 发 现 上 自己 的 解法 并 不 是 最 优 的 ， 但 是 ,倒是 可 以 
作为 一 个 面试 题 的 题目 ， 第 一 章 的 “程序 理解 和 时 间 分 析 ” 就 是 这 么 得 
来 的 。 书 中 有 些 题 目 在 网 上 流传 较 广 ， 但 是 网 上 流传 的 解法 并 不 是 正 
解 ， 我 们 在 书 中 加 上 了 详细 的 分 析 ， 并 提出 了 一 些 扩展 问题 。 还 有 一 
些 题 目 在 教科 书 和 专业 书籍 中 有 更 深入 的 分 析 和 人 解 舍 ， 读 者 可 以 参 
考 。 

书 中 的 大 多 数 题 目 都 能 在 45 分 钟 内 解决 ， 这 也 是 微软 一 次 技术 面 
试 的 时 间 。 本 书 不 是 一 个 “答案 汇编 ”， 很 多 题目 并 没有 给 出 完整 的 答 


案 ， 有 些 题目 还 有 更 多 的 问题 要 读者 去 解答 ， 这 是 本 书 和 其 他 书籍 不 
一 样 的 地 方 。 面 试 不 是 闭卷 考试 ， 如 果 大 家 都 背 好 了 “井盖 为 什么 是 圆 
的 ”的 答案 来 面试 ， 但 是 却 不 会 变通 ， 那 结果 肯定 是 令 人 失望 的 。 
为 了 方便 读者 评估 自己 的 水 平 ， 我 们 还 按照 每 道 题目 的 难度 制定 
了 相应 的 “ 星 级 ”: 
一 颗 星 : 不 用 查阅 资料 ， 在 20 分 钟 内 完成 ; 
两 颗 星 : 可 以 在 40 分 钟 内 完成 ; 
三 颗 星 : 需要 查阅 一 些 资料 ， 在 60 分 钟 内 完成 。 
由 于 每 个 人 的 专业 背景 、 经 历 、 兴 趣 不 一 样 ， 这 种 * 星 级 ”仅仅 是 
一 种 参考 。 
作者 们 水 平 有 限 ， 书 中 的 题目 并 不 能 代表 程序 设计 各 个 方面 的 最 
新 进展 ， 虽 然 经 过 几 轮 审核 ， 不 少 解 法 仍 可 能 有 漏洞 或 错误 ， 和 希望 广 
大 读者 能 给 我 们 指正 。 我 们 计划 在 微软 亚洲 研究 院 的 门户 网 站 
(www.msra.cn) 上 开辟 专栏 和 读者 交流 初学 者 和 高 手 都 非常 欢 
迎 ! 
本 书 的 内 容 分 为 下 面 几 个 部 分 : 
游戏 之 乐 : 电脑 上 的 游戏 是 给 人 玩 的 ，CPU 也 可 以 让 人 “ 玩 ”。 
这 一 部 分 的 题目 从 游戏 和 作者 平时 遇 到 的 有 趣 问 题 出 发 ， 展 现 一 些 并 
不 为 人 重视 的 问题 ， 并 且 加 以 分 析 和 总 结 。 和 希望 其 中 化 每 为 简 的 思 
能 够 对 读者 解决 其 他 复杂 问题 有 所 帮助 。 
数字 之 魅 : 编程 的 过 程 实际 上 就 是 和 数字 及 字符 打交道 的 过 
程 。 如 何 提高 掌控 这 些 数字 和 字符 的 能 力 对 提高 编程 能 力 至 关 重 要 。 
这 一 部 分 收集 了 一 些 好 玩 的 对 数字 进行 处 理 的 题目 。 
结构 之 法 : 对 字符 及 常用 数据 结构 的 处 理 几乎 是 每 个 程序 必然 
会 涉及 的 问题 ， 这 一 部 分 汇集 了 对 常用 的 字符 串 、 链 表 、 队 列 ， 以 及 
树 等 进行 操作 的 题目 。 
数学 之 趣 : 书 中 还 列 了 一 些 不 需要 写 具体 程序 的 数学 问题 ， 但 
是 其 中 显示 的 原理 和 解决 问题 的 思路 对 于 提高 思维 能 力 还 是 很 重要 
的 ， 我 们 把 它们 单独 列 出 来 。 


关于 笔试 、 面 试 、 职 业 选 择 的 一 些 问答 : 微软 的 面 经 ， 各 种 技 

术 职 位 的 介绍 是 很 多 学 生 所 关心 的 内 容 ， 因 此 我 们 把 一 些 相关 的 介绍 
和 讨论 也 收录 了 进来 。 

我 们 希望 《编程 之 美 》 的 读者 是 : 

1. 大 学 计算 机 系 、 软 件 学 院 或 相关 专业 的 大 学 生 、 研 究 生 ， 可 以 
把 这 本 书 当 作 一 个 习题 集 。 

2. 面临 求职 笔试 、 面 试 的 IT 从 业 人 员 ， 不 妨 把 这 本 书 当 作 “ 面 试 
真题 "”， 演 练 一 下 。 

3. 编程 爱好 者 ， 平 时 可 以 随便 翻 翻 ， 重 温 数 学 和 编程 技能 ， 开 拓 
思路 ， 享 受 思 考 的 乐趣 。 

《编程 之 美 》 由 下 面 几 位 作者 协同 完成 ， 如 果 把 这 本 书 的 写作 比 
作 一 个 软件 项 目 ， 它 有 下 面 的 各 个 阶段 ， 每 个 阶段 则 有 不 同 的 目标 和 
角色 : 

1. 构想 阶段 : 分 欣 。 

2. 计划 阶段 : 分 欣 、 刘 铁 锋 、 莫 瑜 。 

3. 实现 阶段 了 里 程 碑 (一) : 上 述 全 部 人 员 ， 加 上 李 东 、 张 晓 、 
陈 远 、 高 霖 (负责 封面 设计 ) 。 

4. 实现 阶段 .里程 碑 (二 ) : 上 述 全 部 人 员 ， 加 上 深 举 、 胡 窒 。 

5. 稳定 阶段 : 上 述 全 部 人 员 ， 加 上 博文 视点 的 编辑 们 。 

6. 发 布 阶 段 : 分 欣 、 刘 铁 锋 和 博文 视点 的 编辑 们 。 

这 本 书 从 2007 年 2 月 开始 构思 ， 到 2007 年 11 月 底 交 出 完整 的 第 一 
稿 ， 花 费 的 时 间 比 每 一 位 作者 预想 的 要 长 得 多 ， 一 方面 是 大 家 都 有 日 
常 的 工作 和 学 习 任务 要 完成 ; 更 重要 的 是 ， 美 的 创造 和 提炼 ， 是 一 个 
漫长 和 痛苦 的 过 程 。 要 把 “编程 之 美 ?表达 出 来 ， 不 是 一 件 容易 的 事 ， 
需要 创造 力 、 想 象 力 和 持久 的 艰苦 劳作 。 就 像 沈 向 洋 博士 经 常 讲 的 一 
句 话 


Nothing replaces hard worko 
这 本 书 的 各 位 作者 ， 都 是 利用 自己 的 业余 时 间 参 与 这 个 项 目的 ， 
他 们 的 创造 力 、 热 情 、 执 着 和 专业 精神 让 这 本 书 从 一 个 模糊 的 构想 变 


成 了 现实 。 通 过 这 次 合作 ， 我 从 他 们 那里 学 到 了 很 多 ， 借 此 机 会 ， 我 
对 所 有 参与 这 个 项 目的 同仁 们 说 一 声 : 谢谢 ! 

在 本 书 编写 过 程 中 ， 作 者 们 得 到 了 微软 亚洲 研究 院 的 许多 同事 的 
帮助 ， 具 体 请 参见 “致谢 ”。 

我 们 希望 书 中 展现 的 题目 和 分 析 ， 能 像 海 淮 上 美丽 的 石子 和 漂亮 
的 贝壳 那样 ， 反 映 出 造化 之 美 ， 编 程 之 美 。 


邹 欣 
2007 年 11 月 于 北京 


致谢 


《编程 之 美 》 这 本 书 从 构思 、 编 写 到 最 后 的 出 版 ， 得 到 了 许多 同 
事 和 朋友 的 帮助 。 在 此 作者 们 要 特别 感谢 以 下 的 人 士 : 

微软 亚洲 研究 院 的 多 位 同事 热情 地 与 我 们 分 享 了 他 们 觉得 有 意思 
的 题目 ， 他 们 分 别 是 : 邓 科 峰 、 宋 京 民 、 宋 江 云 、 刘 晓 辉 、 赵 来 、 李 
劲 宇 、 李 愈 胜 和 Matt Scotto 

感谢 微软 亚洲 研究 院 技术 创新 组 的 同事 梁 潇 、 有 正秋 丰 ， 他 们 认真 
审阅 了 所 有 的 题目 和 解答 ， 找 出 了 不 少 bug?。 技 术 创 新 组 的 另外 几 位 
优秀 工程 师 李 人 鳄 胜 、 魏 蜂 、 赵 婧 还 帮助 我 们 解决 了 书 中 的 几 个 难题 。 

感谢 研究 院 的 同事 、 ee 他 审阅 
了 全 部 稿件 ， 并 且 提 出 了 不 少 意 

ee 1 院 的 实习 生 高 霖 之 手 ， 他 在 10 余 个 
构图 都 否定 的 情况 下 ， 坚 持 不 懈 ， 最 后 拿 出 了 “ 九 连环 ”的 封面 设 
计 ， 得 到 作者 和 出 版 方 的 一 致 认同 。 

ov 作者 们 各 自 的 “老板 一 一 杨 晓 松 、 姚 麒 、 

田 江 和 森 和 刘 激 扬 都 给 予 了 不 少 支 持 ， 在 此 特 表 示 感 谢 。 

作者 们 的 “老板 的 老板 >， 研究 院 前 任 院 长 ， 微 软 公司 资深 副 总 裁 
沈 向 洋 博 士 ， 现 任 院 长 洪 小 文博 士 对 本 书 一 直 很 关心 和 支持 。 沈 向 洋 
博士 在 百 忙 之 中 还 杀 目 为 本 书写 了 序 。 

微软 亚洲 研究 院 市 场 部 的 金 俊 女 士 、 葛 瑜 女士 对 本 书 的 推广 提供 
了 很 大 帮助 。 负 责 www.msra.cn 网 站 的 徐 鹏 、 马 小 宁 、 黄 贤 俊 为 本 书 设 
计 了 专栏 。 

感谢 博文 视点 编辑 团队 。 感 谢 在 本 书写 作 前 期 与 我 们 合作 过 的 编 
辑 方舟 ， 在 写作 后 期 参与 合作 的 编辑 徐 定 猎 和 李 河 疲 。 特 别 感谢 自 始 
至 终 和 作者 们 一 起 工作 的 博文 视点 编辑 周 笃 、 杨 绣 国 。 他 们 和 作者 们 ] 


一 同 构思 ， 耐 心 修 改 ， 没 有 他 们 的 不 懈 努 力 ， 以 及 细致 的 编辑 和 推广 
工作 ， 就 没有 《编程 之 美 》 的 成 功 上 市 。 


注释 


QD ”本 书 残留 的 bug 都 是 作者 们 的 责任 。 


面试 杂谈 


背景 


每 年 从 金秋 九 月 起 ， 校 园 里 的 广告 栏 中 、BBS 上 的 招聘 信息 就 逐 
渐 多 了 起 来 。 小 飞 是 一 名 普通 高 校 的 应 届 计 算 机 专业 硕士 毕业 生 ， 他 
勤奋 好 学 ， 成 绩 中 上 ， 爱 好 广汽 。 他 看 到 身边 的 同学 都 在 准备 精美 的 
简历 ， 参 加 各 种 各 样 的 招聘 会 ， 笔 试 、 面 试 ， 他 也 坐 不 住 了 。 他 在 
BBS 上 看 了 各 式 各 样 的 “ 面 经 "， 也 挤 过 招聘 会 上 的 人 潮 ， 长 叹 :“ 行 路 
难 ， 行 路 难 ， 好 工作 ， 今 安 在 ? ” 

小 《从 网 上 了 解 到 了 有 天 招聘 的 各 种 术语 ， 他 整理 了 一 个 列表 : 


名 词 解释 

面 经 面试 的 经 历 。 

默 拒 投了 简历 ， 进 行 了 面试 ， 但 是 公司 从 此 再 也 没有 消息 ， 询 问 也 不 回答 。 
0 ffer 公司 给 学 生发 的 入 职 邀 请 。 


通常 指 一 群 人 一 起 参加 面试 ， 一 般 以 多 对 多 的 形式 同时 进行 ， 最 后 总 是 会 有 人 被 不 幸 淘 


群 殴 

汰 ， 这 一 过 程 就 叫做 “和 群 殴 ”。 
听 霸 凡 校 内 招聘 演讲 会 都 出 席 旁 听 的 。 
投 害 凡 公司 招 人 都 投 简历 的 。 
笔 霸 凡 投 出 简历 都 能 得 到 笔试 机 会 的 。 
面 霸 凡 参 加 笔试 都 有 面试 通知 的 。 


巨 无 条 | 在 招聘 过 程 屡屡 被 拒 、 机 会 全 无 的 ， 江 湖人 称 “ 巨 无 霸 ”! 
“霸王 面 ” 指 没有 获得 面试 资格 ， 却 主动 找 用 人 单位 ， 要 求 面 试 的 人 ， 源 目 吃 饭 不 给 钱 


本 六 丽 | 一， 人 
的 “ 霜 王 和 父 ” 即 “ 没 机 会 面 ， 创 造 机 会 也 要 面 ”。 


小 “获得 了 一 个 在 微软 亚洲 研究 院 实习 的 机 会 ， 在 工作 中 认识 了 
一 位 有 丰 晤 招聘 经 验 的 研发 经 理 。 他 对 经 理 进 行 了 非 正 式 的 采访 ， 希 
望 能 得 到 第 一 手 的 “内 幕 ” 消 息 。 下 面 就 是 小 飞 整理 出 来 的 间 答 。 小 飞 
的 问题 用 Q 来 标注 ， 经 理 的 回答 用 A 标注 。 


典型 面试 


备注 : 在 本 文中 ， 应 聘 者 (英文 为 : candidate，interviewee) 指 应 聘 公 
司职 位 的 学 生 或 其 他 社会 人 士 ; 面试 者 (英文 为 : interviewer) 指 公 司 
里 进行 招聘 和 面试 的 人 员 。 

Q: 经 理 ， 您 好 。 我 就 开门 见 山 ， 您 能 否 分 享 一 下 当年 您 第 一 次 去 面试 
的 故事 ? 

A: 好 ， 大 学 毕业 后 ， 我 进入 了 学 校 “ 产 业 办 * 开 的 公司 。 有 一 天 ， 一 家 
美国 公司 《我 们 姑且 叫 它 H 公 司 ) 要 来 招 人 ， 这 是 我 的 第 一 次 面试 。 那 
个 公司 的 代表 和 我 寒 暗 之 后 ， 递 给 我 一 道 题 目 ， 题 目 大 意 是 “ 写 一 个 消 
数 ， 返 回 一 个 数组 中 所 有 元 素 被 第 一 个 元 素 除 的 结果 ”。 我 当时 还 问 了 
一 些 问题 ， 以 确保 理解 无 误 ， 所 谓 clarification 是 也 。 那 位 面试 者 简单 地 
解释 了 一 下 ， 然 后 就 在 电脑 上 敦 训 打 打 ， 也 不 理 我 了 。 我 想 这 也 不 
难 ， 如 何 能 显示 我 的 功力 呢 ? 于 是 我 就 把 循环 倒 着 写 for(i=n;i>=0;i--)， 
因为 我 当时 看 到 一 本 Unix 书 上 是 这 么 写 的 。 

代码 大 概 是 这 样 的 : 


vArray (int * pArray, int size) 


写 完 之 后 ， 他 看 了 看 就 问 我 ， 你 为 什么 要 这 么 与 循环 ”如 果 不 这 
么 写 可 以 么 ? 我 说 ， 也 可 以 呀 。 他 间 了 两 这， 如 果 正 着 写 循 环 会 出 现 
什么 问题 。 我 想 ， 能 有 喻 问题 ? 就 把 循环 正 着 瑟 。 噢 ， 原 来 陷阱 在 这 
里 ! 你 知道 这 个 陷阱 是 什么 吗 ? 

Q: 让 我 想 一 想 ， 知 道 了 ， 如 果 循 环 从 数组 的 第 一 个 元 素 开 始 ， 并 且 不 
用 其 他 变量 的 话 ， 在 循环 的 第 一 步 ， 第 一 个 元 素 就 变 成 了 1， 然 后 再 用 
它 去 除 以 其 他 元 素 ， 融 不 符合 题目 要 求 了 。 


A: 对 ， 同 时 还 有 另 一 个 陷阱 一 一 看 看 你 是 否 会 检查 除数 为 零 的 情况 ， 

以 及 对 参数 的 检查 ， 等 等 。 

Q: 这 不 是 很 简单 么 ?一 会 儿 就 写 完 了 。 

A: 面试 题 大 多 数 不 难 ， 但 是 通过 观察 应 聘 者 写 程 序 的 实际 过 程 ， 面 试 

者 可 以 看 出 应 聘 者 的 思维 、 分 析 、 编 程 能 力 。 面 试 者 一 般 还 会 有 后 面 

A 比如 ， 如 果 你 要 测试 刚才 写 的 这 个 函数 ， 你 的 测试 用 例 有 
多 少 ? 或 者 改变 一 些 条 件 ， 能 否 做 得 出 来 ? 

。 很 多 人 说 ， 面 试 是 一 个 不 公平 的 游戏 ， 因 为 信息 不 对 称 。 比 如 : 面 

试 者 知道 问题 的 答案 ， 而 应 聘 者 不 知道 ， 面 试 者 知道 今年 公司 要 招 几 

es 而 应 聘 者 不 知道 。 

A: 但 是 ， 应 聘 者 手头 有 几 个 Offer， 面 试 者 也 不 知道 。 应 聘 者 是 否 喜欢 

公司 提供 的 职 位 和 新 酬 ， 面 试 者 也 不 知道 。 一 方面 ， 应 聘 者 在 “ 求 ” 

职 ， 另 一 方面 ， 面 试 者 也 在 “ 求 才 。 面 试 也 是 一 个 增进 双方 互相 了 解 

的 有 效 途 径 。 

既然 扯 到 了 “信息 不 对 称 ”， 我 再 讲 一 个 我 的 故事 ， 当 年 H 公 司 来 我 
校 面 试 的 时 候 ， 我 对 HH 公司 的 了 解 仅 限于 H 公 司 捐赠 给 我 们 计算 机 系 的 
一 个 有 些 过 时 的 小 型 机 系统 。 我 想 ， 这 个 H 公 司 是 不 是 还 有 一 些 新 东 
西 ? 那 时 候 还 没有 互联 网 ， 于 是 我 就 托 人 借 了 几 本 原版 的 Byte 杂 志 来 
看 ， 那 是 很 厚 的 一 本 杂志 ， 非 常 多 的 广告 ， 看 了 半天 ， 夹 在 杂志 中 的 
小 广告 掉 了 一 地 。 我 只 看 开 | 杂志 对 日 公司 新 出 的 一 个 桌面 管理 软件 
“NewWave” 的 评价 ， 我 琢磨 了 半天 ， 大 概 搞 履 了 这 是 一 个 什么 东西 ， 
市 场 上 还 有 什么 竞争 对 手 ， 等 等 。 

过 了 两 天 ， 面 试 开 始 了 ， 对 方 端 坐 在 沙发 里 问 “ 你 对 我 们 H 公 司 有 
何 了 解 ? ”我 先 说 了 H 公 司 的 小 型 机 系统 ， 然 后 说 ，“By the way， 我 还 
了 解 了 NewWave”。 0 下 。 没 想到 对 方 坐 直 
了 身子 ， 说 这 个 NewWave 就 是 他 曾经 领导 的 项 目 。 于 是 我 就 根据 杂志 
上 的 描述 问 ， ee 他 很 兴奋 地 跟 我 谈 了 
NewWave 是 如 何 的 领先 ， 等 等 。 后 来 我 们 又 聊 了 不 少 相 关 的 东西 。 

最 后 所 有 人 面试 结束 之 后 ， 我 们 的 领导 说 ， 美 方 觉得 我 很 突出 ， 
知道 不 少 东 西 ， 包 括 NewWave， 口 语 也 很 好 。 领 导 就 要 求 我 给 所 有 人 


都 介绍 一 下 NewWave， 我 只 好 把 看 到 的 东西 又 复述 了 一 次 。 不 久 ，H 公 
司 过 来 面试 的 男 一 个 经 理 不 解 地 对 我 们 领导 说 :“ 为 什么 你 们 这 么 多 人 
知道 NewWave? ” 

前 不 久 ， 我 在 面试 的 时 候 问 一 位 同学 , “你 对 微软 亚洲 研究 院 有 什 
么 了 解 ? ”他 说 ,“ 没 哈 了 解 ， 昨 天 打 电 话 叫 我 来 面试 ， 我 就 来 了 ..…………” 
对 于 这 样 的 同学 ， 信 息 的 确 是 非常 不 对 称 ， 那 他 吃亏 也 是 难免 的 了 。 
还 有 一 位 在 面试 中 发 挥 得 很 不 好 的 同学 跟 我 说 ， 他 特地 没有 做 任何 准 
备 ， 因 为 他 想 显 示 他 的 “raw talent”..………. 

Q: 关于 Test (测试 ) 的 职位 ， 有 没有 一 些 典型 的 题目 呢 ? 

A: 有 了 哇 ， 上 典型 的 题目 如 给 你 一 支 笔 ， 让 你 说 说 你 如 何 测试 一 一 据说 要 
测试 12 个 方面 ; 再 比如 判断 一 个 三 角形 的 特性 (直角 、 钝 角 、 锐 角 、 
等 腰 ) 据说 有 20 多 个 测试 用 例 ， 这 是 要 考察 大 家 思考 问题 的 全 面 
程度 和 逻辑 分 析 能 力 (测试 用 例 见 4.8 节 “三 角形 测试 用 例 ”) 。 

Q: 网 上 有 些 非常 流行 的 问题 ， 都 号 称 是 从 大 公司 流传 出 去 的 ， 是 真 的 
么 ? 

A: 对 ， 是 有 一 些 题目 比较 常见 ， 例 如 “下水道 的 井盖 为 什么 是 圆 的 ”， 
还 有 一 个 问题 一 度 非常 流行 ， 据 说 早期 应 聘 PM (Program Manager 程 序 
经 理 ) 职位 的 应 聘 者 大 多 曾 碰 到 这 个 题目 : 

房间 里 有 三 瘟 灯 ， 屋 外 有 三 个 开关 ， 分 别 控制 这 三 瘟 灯 ， 只 有 进 
入 房间 ， 才 能 看 到 哪 一 个 电灯 是 亮 的 。 请 问 如 何 只 进入 房间 一 次 ， 就 
能 指明 哪 一 个 开关 控制 哪 一 个 灯 ? 

传说 在 晚上 上， 微软 一 些 会 议 室 的 灯 忽 明 忽 火 ， 那 就 是 一 些 还 没有 
搞 懂 的 同事 们 在 实地 钻研 。 

Q: 我 大 概 了 解 了 DewPMVTest 这 三 种 工作 的 典型 面试 题 ， 那 么 这 些 题 
目的 答案 别人 都 知道 了 ， 还 怎么 面试 呢 ? 

A: 对 ， 会 有 不 少 题目 流传 出 去 ， 这 本 来 无 妨 。 但 是 一 些 人 知道 答案 之 
后 ， 就 开始 背诵 ， 或 者 原封 不 动 地 拿 它 去 面试 应 聘 者 ， 忘 了 “知道 答 
案 ” 和 “能 做 一 个 好 员工 ”的 关系。 知道 了 题目 的 答案 ， 就 能 做 一 个 好 的 
开发 人 员 、 项 目 经 理 ， 或 者 销售 经 理 么 ?一 个 极端 的 情况 会 是 : 公司 


里 每 一 个 人 都 知道 哪 盖 灯 是 由 哪 一 个 开关 控制 的 ， 如 何 测 试 三 角形 的 
类 别 等 ， 但 是 这 个 公司 真能 从 此 开发 出 更 好 的 软件 么 ? 

一 句 话 : 关键 不 在 于 答案 ， 而 在 于 思考 问题 的 方法 ， 这 也 是 我 们 
没有 “题库 ”的 原因 。 


研发 职位 的 选择 


Q: 微软 及 很 多 其 他 软件 公司 都 有 不 少 研发 职位 ， 名 称 不 尽 相 同 ， 而 且 
还 是 缩写 ， 能 不 能 讲解 一 下 ? 
A: 不 少 同学 对 微软 公司 的 各 种 研发 职位 (Discipline) 并 不 太 了 解 ， 我 
们 在 面试 进行 到 一 半 的 时 候 ， 经 常 发 现 一 个 应 聘 者 其 实 更 适合 做 其 他 
类 型 的 工作 。 当 然 这 时 我 们 可 以 调换 面试 的 方向 ， 但 是 对 应 聘 者 来 说 
总 不 是 一 件 好 事 。 我 刚好 在 BBS 上 看 到 了 一 篇 文章 ， 这 篇 文章 从 个 人 
的 角度 出 发 ， 非 正式 地 讲 了 R&D 各 个 方向 的 特点 ， 昌 然 并 非 完 全 正 
确 ， 介 绍 也 不 一 定 全 面 ， 但 是 我 们 不 妨 看 看 : 

aR: Assistant Researcher，， 助 理 研 究 员 ， 也 可 以 叫 研究 员 助 理 ， 
主要 在 “R&D” 的 “R” 这 一 端 ， 工 作 是 读 论文 ， 提 想法 ， 被 否决 后 再 提 想 
法 (如 此 反复 N 次 ) ， 赶 在 截止 时 间 之 前 提交 论文 。aR 的 想法 得 到 初步 
验证 之 后 ， 还 要 跟 其 他 部 门 推销 自己 的 想法 ， 争 取 把 想法 变 成 产品 。 
aR 的 乐趣 是 能 在 一 个 领域 中 深入 人 研究， 发 表 论 文 ， 申 请 专利 ， 每 个 专 
利 申请 (无 论 是 否 批准 ) 能 给 自己 得 一 块 黑色 立方 体 石头 (如 图 1 所 
示 ) 。 好 多 人 的 桌面 上 堆 了 不 少 石头 ， 好 像 他 们 没什么 苦恼 。aR 有 时 
做 的 事情 和 RSDE 差 不 多 。aR 以 后 会 成 长 为 Associate Researcher ( 副 研 
究 员 ) 、Researcher (研究 员 ) 、 高 级 研究 员 ， 等 等 。 总 之 ， 最 后 就 成 


了 大 家 小 时 候 特 别 区 想 做 的 “科学 家 ” 


图 1 申请 专利 得 到 的 石头 


Dev: 正式 的 名 称 叫 SDE (Software Development Engineer) ， 这 个 
职位 和 aR 相 对 ， 是 在 “R&D” 的 “D” 这 一 端 。 他 们 在 一 个 产品 团队 中 ， 按 
照 严格 的 流程 开发 产品 。MS 的 一 个 产品 发 布 之 后 ， 所 有 成 员 会 得 到 一 
小 块 铁皮 (学 名 叫 “Ship-itAward”， 如 图 2 所 示 ) ， 上 面 写 着 产品 的 名 字 
和 发 布 日 期 ， 资 深 的 Dev 会 收集 到 不 少 ， 他 们 会 认真 地 把 这 些小 铁皮 整 
齐 地 贴 起 来 ， 授 在 办 公 桌 最 高 的 位 置 上 。Dev 的 乐 不 少 ， 这 里 就 不 列举 
了 。 但 是 苦 也 有 不 少 ， 比 如 产品 的 周期 有 时 非常 见长 ， 过 程 定义 得 非 
常 完 备 (有 了 时 不 免 觉 得 太 完 备 了 ) ; 比如 要 维护 老 版 本 ; 比如 要 用 比 
较 成 熟 的 技术 ， 而 不 是 用 最 时 暑 的 东西 来 开发 产品 。 另 外 ，Dev 要 负责 
一 个 或 几 个 模块 ， 这 些 模 块 不 一 定 和 最 终 用 户 打 交道 ， 未 必 是 整个 产 
品 的 核心 模块 。 做 一 个 好 的 Dev 要 生活 在 代码 中 ， 对 代码 和 平台 的 各 种 
细节 要 非常 熟悉 ， 掌 握 非 常 底层 的 技术 ， 有 些 人 以 此 为 乐 ， 有 些 人 则 
未 必 。Dev 的 职业 发 展 道路 很 多 ， 如 果 只 想 钻 研 技术 ， 不 乐意 做 很 多 管 
理工 作 ，Dev 可 以 成 为 非常 高 级 的 工程 师 ， 直 到 杰出 工程 师 

(Distinguished Engineer) 。 当 然 ，Dev 也 可 以 成 长 为 开发 主管 (Dev 
Leader) ， 开 发 总 经 理 (Dev Manager) ， 等 等 。 


图 2 Dev 得 到 的 小 铁 片 SHIP-IT 


Test: 正式 名 称 是 Software Development Engineer in Test 
(SDET) ， 简 称 为 Test 或 SDET ( 读 作 S-DET) 。 这 个 职位 看 似 没有 
Dev 和 aR 酷 ， 但 是 很 有 前 途 ， 首 先 中 国 的 同学 由 于 种 种 原因 (不 了 解 ， 
看 不 起 ， 做 不 来 ) 不 太 愿 意 做 这 种 工作 ， 因 此 ， 公 司 找 人 非常 急迫 ， 
相对 容易 进入 。 这 一 职位 所 谓 的 苦 (也 反映 了 一 些 人 的 偏见 和 误解 ) 
从 传统 意义 上 说 ，SDET 得 等 着 上 家 (PM/Dev) 给 你 东西 ， 你 才能 “ 测 
试 "。 然 而 现代 软件 工程 要 求 TEST 从 项 目 一 开始 就 积极 参与 项 目的 规 
划 ， 了 解 客户 需求 ， 制 定 测试 计划 ， 设 计 测 试 染 构 ， 实 现 测 试 自动 
化 ， 等 等 。 事 实 上 这 些 都 是 开发 的 工作 ， 所 以 他 们 叫 SDE in Test。 而 且 
SDET 能 更 深入 地 了 解 产品 的 各 个 模块 是 如 何 合作 ， 如 何在 实际 情况 下 
被 用 户 使 用 的 。 从 代码 之 外 理解 程序 ， 这 是 测试 之 乐 。 那 种 “产品 发 布 
前 一 个 星期 让 测试 人 员 来 测 一 下 ”的 情况 在 微软 是 不 会 发 生 的 。 那 些 只 
会 用 鼠标 点 击 测 试 ， 然 后 报告 bug 的 人 员 叫 Software Test Engineer 
(STE) ， 这 样 的 事 一 般 会 外 包 给 别 的 公司 。 用 足球 比赛 作 比喻 ，Test 
就 是 最 后 一 道 防线 ， 如 果 你 没有 防守 好 bug，bug 就 会 跑 到 顾客 那里 


去 ， 因 此 Test 工 作 非 常 重要 。Test 的 职业 发 展 和 Dev 类 似 ， 一 直到 有 专 
门 管 Test 工 作 的 副 总 裁 (VP) 。 

PM: 这 恐怕 是 外 界 误解 最 多 的 行当 ， 简 而 言 之 ，Program Manager 

(程序 经 理 ) 做 的 是 开发 和 测试 之 外 的 所 有 事情 。 有 些 同学 会 问 “ 我 写 

程序 都 不 用 测试 ， 那 么 除了 开发 和 测试 之 外 还 有 什么 事 儿 ? ”在 公司 里 
开发 商业 软件 可 没有 那么 简单 ， 比 如 有 10 个 Dev 和 5 个 Test 要 在 一 起 开发 
下 一 个 版 本 的 MSN Messenger， 那 我 们 到 底 要 做 多 长 时 间 才 能 完成 ? 什 
么 事情 先 做 ,什么 事情 后 做 ? 项 目 进行 到 一 半 的 时 候 ， 领 导 说 我 们 改 
名 叫 Live Messenger 取 ， 那 这 一 改名 意味 着 什么 ? 如 何 调整 进度 ? 最 后 
还 剩 下 两 个 月 的 时 候 ， 看 起 来 我 们 的 确 完 不 成 全 部 任务 ， 那 要 怎么 
办 ? 你 又 不 是 Dev 和 Test 的 老板 ， 他 们 和 赁 什么 听 你 的 呢 ? 这 也 是 PM 的 
苦 。PM 的 乐 看 起 来 在 于 ， 他 们 可 以 全 盘 掌 控 一 个 产品 ， 广 泛 了 解 一 个 
行业 ， 和 用 户 打 交道 ， 代 表 团 队 出 席 各 种 会 议 ， 在 公司 内 部 的 曝光 度 
也 比较 高 。 

RSDE: 好 了 ， 我 们 最 后 看 看 RSDE (Research SDE) ， 这 是 微软 
亚洲 研究 院 一 个 比较 特殊 的 队伍 。RSDE 的 乐趣 在 于 可 以 接触 到 各 种 最 
新 的 研究 成 果 ， 并 用 它 来 解决 挑战 性 的 问题 。RSDE 的 苦 在 于 项 目 都 是 
V0.1 版 ， 而 且 做 得 成 功 的 项 目 大 多 数 会 转化 (Transfer) 到 产品 组 中 ， 
由 别人 推 向 市 场 。RSDE 在 和 研究 部 门 合作 的 时 候 ， 就 要 负 起 aR 和 PM 

(甚至 Test) 的 责任 。 刚 开始 ，RSDE 既 没有 R 的 黑石 头 ， 又 没有 D 的 
SHIP-IT 小 铁 片 。RSDE 参 与 的 项 目 有 比较 大 的 风险 ， 经 常会 不 如 预 
期 ， 或 者 会 失败 (这 也 是 科学 研究 的 特点 ) 。 项 目 失败 后 ，RSDE 掩 埋 
了 项 目的 尸体 ， 擦 干 自己 的 血迹 ， 又 得 找 新 的 领域 和 新 的 项 目 。RSDE 
还 有 “创新 ”的 任务 ， 这 个 词 人 人 都 会 说 ， 但 是 要 做 出 来 就 不 是 那么 容 
易 了 ， 全 世界 有 这 么 多 人 在 琢磨 计算 机 ， 你 能 在 什么 地 方 做 的 比 其 他 
任何 人 都 更 进一步 呢 ? 这 也 是 RSDE 的 乐趣 吧 。 有 些 同 学 能 力 很 强 ， 兴 
趣 广 泛 ， 但 是 一 时 也 拿 不 准 自己 要 深入 研究 哪 一 个 领域 ， 这 时 不 妨 来 
做 RSDE。 做 得 好 的 RSDE， 他 们 的 工作 成 果 推进 了 研究 ， 又 走向 了 市 
场 ， 这 样 就 既 可 以 拿 到 黑石 头 ， 又 可 以 拿 到 SHIP-IT 小 铁 片 儿 。 我 个 人 


认为 能 有 机 会 做 RSDE 是 很 令 人 自豪 的 事情 ， 相 当 于 参军 当 上 了 特种 
兵 ， 很 好 ， 很 强大 。 

Q: 看 起 来 真是 眼花 综 乱 ..…...…. 

A: 总 之 ， 每 类 职位 都 很 重要 ， 都 有 存在 的 理由 ， 都 有 不 错 的 发 展 前 
景 ， 都 有 自己 的 苦 和 乐 。 微 软 很 大 ， 微 软 中 国 研发 集团 (CRD) 内 部 
有 很 多 不 同 的 机 构 和 部 门 ， 这 也 意味 着 有 许多 机 会 ， 让 有 能 力 的 同学 
尝试 aR、Dev、Test、RSDE、PM 的 职位 。 


求职 攻略 之 笔试 答疑 


微软 中 国 每 年 都 会 举行 几 次 技术 笔试 ，2006 年 的 笔试 结束 后 ， 主 
持 笔试 的 经 理 回 答 了 学 生 提 出 的 很 多 问题 ， 小 飞 把 这 些 问 答 整 理 如 下 
(下 文 的 “我 们 ” 指 的 是 策划 并 批改 试卷 的 技术 人 员 ) : 

Q: 笔试 的 难度 是 不 是 有 些 太 难 了 ? 

A: 从 分 数 看 ， 参 加 笔试 的 同学 普遍 得 分 较 低 ， 这 说 明 不 少 同学 大 大 低 
估 了 试题 的 难度 ， 或 者 说 低估 了 我 们 对 答案 的 期 望 。 一 言 以 没 之 ， 我 
们 希望 看 到 接近 “职业 ?水 平 的 答案 。 

Q: 为 什么 有 些 人 笔试 得 了 负 分 呢 ? 

A: 这 是 因为 我 们 对 选择 题 采用 了 “不 做 得 零 分 ， 做 错 倒 扣 分 ”的 判 卷 策 
略 。 公 司 的 大 部 分 同事 们 认为 倒 扣 分 是 比较 有 效 的 甄别 方法 。 而 且 我 
们 尽量 避免 非常 偏 俱 的 知识 点 和 有 和 争议 的 答案 。 

Q: 你 们 是 不 是 只 选取 了 其 中 一 些 卷子 判 分 ? 

A: 我 们 对 大 多 数 的 卷子 全 部 判 分 ， 每 个 部 门 都 会 抽调 不 少 工程 师 加 班 
判 卷 ， 同 学 们 写 的 每 一 行文 字 都 会 被 看 到 ， 对 于 一 些 很 难 读 通 的 程 
序 ， 我 们 还 会 一 起 分 析 ， 不 会 因为 一 眼看 不 懂 就 给 个 0 分 。 对 于 单项 题 
答 得 非常 好 的 同学 ， 我 们 会 特别 标记 。 像 这 样 的 无 绝对 标准 答案 的 试 
卷 ， 判 卷 是 相当 累 人 的 活 儿 。 至 于 是 否 全 部 判 分 ， 会 不 会 把 所 有 分 数 
都 全 部 告知 考生 ， 这 由 各 个 部 门 决定 。 

Q: 笔试 题目 全 是 英语 ， 这 究竟 是 考 英 语 还 是 考 技术 ?为 什么 不 用 中 文 
出 题 呢 ? 


A: 微软 公司 的 工作 语言 是 英语 ， 公 司 在 中 国 的 各 个 部 门 (研究 院 ， 工 
程 院 等 ) 都 是 如 此 。 我 们 注意 在 考卷 中 不 用 很 生 俱 的 词汇 ， 以 免 影响 
同学 们 的 发 挥 。 在 有 些 题目 中 ， 我 们 还 增加 了 一 些 注释 ， 并 且 有 一 些 
小 题目 注 明 可 以 用 中 文 回答 。 有 些 考生 英语 写 得 不 错 ， 起 承 转 合 ， 很 
像 GRE/TOFFEL 的 作文 ， 可 惜 只 有 结构 ， 实 质 内 容 不 多 ， 得 分 也 不 
多 。 
Q: 笔试 的 题 量 为 什么 这 么 大 ? 很 多 人 根本 没有 足够 的 时 间 做 完 ! 
A: 每 次 开发 新 的 软件 ， 我 们 的 时 间 也 不 够 ， 这 就 是 做 软件 项 目的 特 
点 。 我 们 看 到 很 多 同学 有 些 大 题 一 个 字 也 没有 写 ， 感 到 很 可 惜 。 其 
实 ， 如 果 时 间 安 排 得 当 ， 至 少 应 该 每 一 道 题 试 着 回答 一 些 基本 问题 。 
我 们 的 很 多 监考 人 员 也 会 提示 大 家 注意 时 间 分 配 。 况 且 ， 如 何在 有 压 
力 的 情况 下 最 有 效 地 分 配 时 间 ， 这 也 是 一 个 人 非常 重要 的 能 力 。 
Q: 我 觉得 我 回答 得 不 错 ， 每 道 题目 都 差不多 做 出 来 了 ， 为 什么 分 数 很 
低 ? 
A: 有 必要 解释 一 下 ， 我 们 的 评分 标准 可 能 和 学 校 里 不 一 样 。 比 如 说 有 
一 道 程 序 改 错 题 ， 正 确 的 解法 要 纠正 五 个 错误 。 我 们 的 评分 标准 是 : 

如 果 五 个 错误 全 部 改正 ， 满 分 。 

如 果 找 到 4 个 错误 ， 只 能 得 一 半分 。 

如 果 只 找到 3 个 错误 ， 得 1/3 分 。 

如 果 只 找到 2 个 错误 ， 得 1/4 分 。 

我 们 的 评分 标准 要 拉 开 * 满 分 ”和 其 他 “差不多 ”的 答案 的 距离 。 如 果 
你 每 一 道 题目 都 “差不多 ”， 那 你 的 总 分 将 是 全 部 分 数 的 一 半 以 下 。 
Q: 我 会 C#、VB.NET， 为 什么 微软 的 笔试 偏偏 要 求 用 C 语 言 答 题 ? 
A: 对 于 微软 的 工程 师 来 说 ，C 语 言 是 基本 功 。 
Q: 为 什么 我 投 一 个 技术 支持 的 职位 也 要 用 这 么 难 的 题 来 折磨 我 ? 
A: 因为 投 同 一 个 位 置 的 人 太 多 了 。 大 家 的 简历 都 很 优秀 ， 所 以 只 好 用 
笔试 来 进行 一 次 筛选 。 
Q: 考题 包罗 万 象 ， 甚 至 包括 我 不 熟悉 的 知识 领域 ， 难 道 微软 需要 的 是 
“全 才 ” 吗 ? 


A: 我 们 的 考试 是 想 考 察 在 实战 中 的 基本 知识 和 基本 技能 。 考 试 不 是 万 
能 的 ， 笔 试 总 分 很 高 的 同学 ， 也 有 在 面试 中 表现 得 很 不 如 人 意 的 。 如 
果 有 人 在 某 些 题目 中 有 优异 的 表现 ， 即 使 总 分 不 高 ， 我 们 也 会 考虑 
的 。 

Q: 我 申请 的 职位 比较 特别 ， 自 己 的 专长 没有 能 够 显露 ， 通 过 这 样 的 一 
个 考试 不 能 真实 反映 出 个 人 特点 ， 有 什么 办 法 呢 ? 

A: 这 一 点 我 们 同意 ， 我 们 考试 的 主要 目的 是 把 所 有 考生 中 的 优秀 学 生 
选 出 ， 并 安排 他 们 进入 下 一 轮 。 至 于 在 某 一 方面 有 专长 的 同学 ， 他 们 
应 该 直接 和 有 关 部 门 联系 ， 或 者 我 们 的 有 关 部 门 应 该 直接 联系 这 些 同 
学 ， 例 如 在 某 些 研究 领域 发 表 过 高 水 平 文 章 的 同学 。 

Q: 笔试 通 不 通过 是 不 是 还 有 些 运气 成 分 在 里 面 ? 

A: 当然 有 ， 大 家 也 都 知道 ， 一 次 笔试 不 能 够 反映 一 个 人 完全 的 、 真 实 
的 水 平 。 同 学 们 塞 窗 十 多 年 ， 经 历 了 无 数 闭卷 考试 ， 作 为 一 个 过 来 
人 ， 我 觉得 职业 生涯 和 人 生 不 是 一 次 两 小 时 的 闭卷 考试 能 决定 的 ， 硕 
望 这 样 的 笔试 是 大 家 人 生 中 倒数 第 几 次 的 闭卷 考试 之 一 。 人 生 是 更 加 
开阔 、 充 满 更 多 变数 的 开卷 考试 。 不 管 是 开卷 、 闭 卷 ， 都 是 一 分 耕 
耘 ， 一 分 收获 。 


求职 攻略 之 决胜 面试 


经 历 了 笔试 、 电 话 面试 之 后 ， 许 多 同学 接 到 了 微软 公司 的 邀请 
一 一 来 公司 进行 面对面 的 考察 。 
Q: 既然 微软 这 么 重视 实际 的 能 力 ， 每 一 个 人 都 会 经 过 几 轮 面试 的 考 
察 ， 在 学 校 时 的 学 习 成 绩 是 否 就 不 重要 了 ? 
A: 也 不 一 定 。 同 样 ， 天 键 不 是 在 于 静态 的 成 绩 ， 而 是 通过 成 绩 了 解 成 
绩 取得 的 过 程 ， 了 解 一 个 人 的 特质 。 曾 经 有 一 个 面试 者 详细 询问 了 一 
个 应 聘 者 在 学 校 里 的 各 种 表现 ， 最 后 在 面试 报告 中 写 道 :“ 我 详细 询问 
了 她 从 中 学 到 大 学 、 研 究 生 的 情况 ， 她 在 学 校 里 没有 一 科 的 成 绩 是 非 
单 拔尖 的 ， 也 没有 太 坏 的 成 绩 。 她 从 来 没有 做 过 出 格 的 事情 ， 如 逃 
课 、 上 自己 写 一 些 程序 、 打 工 等 。 我 在 她 身上 看 不 到 对 卓越 的 追求 ， 也 


没有 看 到 她 有 实现 自身 价值 的 想法 ..…. 所 以 我 认为 本 公司 不 应 该 雇用 
她 。” 
Q: 虽然 我 没什么 想法 ， 但 我 觉得 微软 太 有 名 了 ， 我 也 不 用 多 想 了 ， 我 
就 是 要 进 这 样 的 公司 ， 你 叫 我 干什么 都 可 以 ! 
A: 我 们 恰恰 不 太 需 要 没什么 想法 的 人 ， 这 也 许 和 企业 文化 有 一 些 关 
系 。 在 中 国 一 些 企业 的 文化 中 ， 往 往 是 领导 安排 你 做 什么 ， 你 就 做 什 
么 。 在 微软 ， 我 们 认为 每 个 人 都 是 独立 的 个 体 ， 我 们 希望 雇员 能 够 “在 
其 位 ， 谋 其 事 ”， 同 时 能 考虑 到 自己 三 五 年 后 的 发 展 ， 并 且 能 自己 制定 
计划 去 实现 事业 目标 ， 这 是 公司 的 文化 。 
Q: 面试 的 时 候 要 穿 什么 衣服 ? 
A: 在 没有 特别 规定 的 情况 下 ， 穿 你 觉得 舒服 的 衣服 就 行 。 我 们 看 到 不 
少 应 聘 者 穿着 明显 不 舒服 的 西装 来 面试 ， 这 样 不 会 给 自己 加 分 ， 当 然 
也 不 会 减 分 。 但 是 自己 太 不 舒服 ， 会 影响 发 挥 。 
Q: 不 舒服 没关系 ， 只 要 你 们 公司 觉得 舒服 ， 我 就 舒服 。 
A: 我 们 刚刚 说 过 ， 微 软 更 看 重 的 是 “你 ”是 否 觉得 舒服 , “你 ”要 做 什 
么 ， 以 及 “你 ”有 什么 创意 。 
Q: 有 没有 在 面试 中 作 星 的 呢 ? 
A: 说 起 来 ， 还 真有 。 有 一 天 ， 我 在 微软 外 面 的 一 个 中 餐馆 吃 晚饭 ， 这 
个 餐馆 很 小 ， 大 家 坐 得 比较 挤 ， 我 不 得 不 听 到 邻 座 的 高 谈 阔 论 。 原 来 
是 一 个 刚刚 在 微软 面试 过 的 学 生 在 和 几 个 同学 聚餐 ， 他 很 兴奋 地 谈 着 
当天 面试 的 经 历 一 一 

“他 问 了 那个 在 链表 中 找 回路 的 问题 了 么 ? ” 

“ 问 了 ， 我 假装 思考 了 一 下 ， 稍 稍 试 了 试 别 的 解法 ， 然 后 就 把 你 说 
的 那个 解法 讲 了 出 来 .….…..” 

对 于 这 种 人 ， 我 们 内 部 叫 “Poser” 一 一 摆 姿 势 的 人 。 如 果 你 在 面试 
时 恰好 被 问 到 了 一 道 知道 答案 的 题目 ， 你 可 以 向 面试 者 提出 来 。 摆 次 
势 的 话 ， 万 一 被 惟 破 ， 会 比较 难堪 。 既 然 你 已 经 花 了 时 间 了 解 解法 ， 
不 妨 和 面试 者 深入 地 探讨 一 下 。 
Q: 大 家 发 表 在 BBS 上 的 面 经 ， 公 司 看 不 看 ? 


A: 公司 的 一 些 员工 也 在 看 ， 有 一 次 ，HR 在 某 BBS 上 看 到 一 篇 很 详细 
的 面 经 ， 文 笔 生动 ， 此 文章 从 他 看 到 HR JJ 的 那 一 刻写 起 ， 直 到 做 了 什 
么 题目 、 怎 么 做 的 、 说 了 什么 话 、 最 后 如 何 走出 了 公司 大 门 他 都 做 了 
详细 记录 。 从 描述 上 看 ， 我 们 很 容易 就 能 推断 出 这 是 哪 一 位 应 聘 者 。 
他 似乎 发 挥 得 很 不 错 ， 可 惜 他 所 了 在 开始 面试 的 时 候 ，HR JJ 给 他 讲 
的 ， 他 也 签 了 自己 大 名 的 保密 协定 。 对 于 这 样 的 同学 ， 我 们 只 能 遗憾 
地 放弃 了 。 

Q: 整个 面试 过 程 中 我 觉得 自己 答 得 很 不 错 了 ， 面 试 者 指出 的 问题 我 大 
部 分 都 能 回答 出 来 ， 为 什么 我 还 是 没有 通过 ? 

A: 一 个 原因 是 有 比 你 更 厉害 的 应 聘 者 ， 另 一 个 大 家 容易 忽略 的 原因 
是 ， 应 聘 者 和 面试 者 对 于 “不 错 ” 的 定义 是 不 一 样 的 (参见 对 笔试 问题 
的 回答 ) 。 

对 于 在 校 学 生 ， 觉 得 自己 写 的 程序 ， 涂 涂改 改 ， 大 概 逻 辑 能 通过 
就 行 了 ， 面 试 者 指出 的 问题 能 答 出 来 一 些 就 行 了 。 但 是 对 于 将 来 的 公 
司 员工 ， 我 们 要 考察 : 程序 设计 的 思路 如 何 ? 编程 风格 如 何 ? 细节 是 
否 考虑 到 ? 程序 是 否 有 内 存 泄 露 ? 是 否 采用 了 最 优 算 法 ? 是 否 能 对 程 
序 进行 修改 以 满足 不 断 变化 的 需求 ? 是 否 能 举一反三 ? 

另外 ， 除 了 专业 技巧 ， 我 们 在 面试 中 还 会 考察 应 聘 者 的 职业 技巧 

(professional skills， 也 有 人 称 为 soft skills) 。 这 个 人 的 交流 能 力 、 合 
作 能 力 如 何 ， 对 自己 的 评价 和 期 望 是 什么 ? 在 有 压力 的 情况 下 ， 能 否 
发 挥 水 平 ? 是 否 追 求 卓 越 ? 这 些 “ 非 技术 ”的 因素 相当 重要 。 

Q: 很 多 有 名 的 企业 面试 只 要 求 谈 谈 就 可 以 了 ， 为 什么 微软 一 定 要 写 代 
码 ? 

A: 我 们 的 绝 大 部 分 工作 ， 都 是 通过 代码 而 来 ， 很 大 一 部 分 的 问题 ， 也 
是 由 代码 所 导致 的 。 所 以 我 们 不 能 不 重视 写 代 码 这 件 事 。 当 然 有 很 多 
其 他 工作 不 需要 写 代码 ， 但 这 不 在 我 们 的 讨论 范围 内 。 

有 一 次 我 在 过 道上 碰 到 一 个 同事 陪 着 一 个 应 聘 者 走出 大 楼 ， 这 位 
应 聘 者 边 走边 侃侃 而 谈 。 后 来 我 问 这 位 同事 详情 。 他 说 , “这 位 先生 表 
达能 力 不 错 ， 但 是 当 我 叫 他 写 一 个 小 程序 的 时 候 ， 他 死活 不 动手 。 他 
说 在 以 前 的 工作 中 ， 如 果 要 写 代 码 ， 从 MSDN 上 拷贝 一 些 下 来 就 行 


了 。 我 和 他 僵持 了 一 会 儿 之 后 ， 只 好 说 ， 那 你 要 是 不 写 的 话 ， 我 们 就 
没什么 可 谈 的 了 。 所 以 后 面 的 面试 都 没有 必要 了 ， 我 直接 送 他 出 了 
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有 一 次 我 收 到 我 们 开发 总 经 理 的 邮件 ， 上 面 强调 了 面试 的 时 候 一 
定 要 让 应 聘 者 动手 写 代 码 等 ， 这 时 对 面 的 一 位 同事 不 好 意思 地 说 ， 他 
今天 碰 到 的 应 聘 者 是 以 前 朋友 的 朋友 。 两 人 聊 了 很 长 时 间 的 闲话 ， 后 
来 他 不 好 意思 叫 他 写 代 码 ， 时 间 也 不 够 了 ， 于 是 就 写 了 一 些 反 馈 ， 说 
这 人 看 起 来 还 行 。 没 想到 开发 总 经 理 眼 尖 ， 把 这 个 问题 揪 出 来 了 。 
Q: 市 场 上 有 很 多 号 称 宝典 的 面试 书籍 ， 这 些 的 确 是 外 企 用 的 面试 题目 
么 ? 我 看 到 一 本 ， 就 像 是 网 络 上 流传 的 各 种 面 经 的 汇编 ， 好 像 没有 太 
大 的 价值 。 
A: 我 觉得 最 好 的 技术 面试 “宝典 ?， 就 是 讲 算法 和 数据 结构 的 经 典 著 
作 。 微 软 亚 洲 研究 院 的 工程 师 们 在 长 期 的 面试 过 程 中 ， 也 收集 了 一 些 
有 意思 的 面试 题目 ， 叫 《编程 之 美 》， 听 说 马上 就 要 出 版 了 。 
Q: 太 好 了 ! 这 本 书 里 面 一 定 有 无 数 的 产 代 码 供 学 生 们 钻研 吧 ? 
A: 其 实 ， 大 部 分 题目 都 不 需要 连篇 昧 息 的 程序 来 解决 ， 聪 明 的 解法 通 
常 是 非常 简明 的 。 药 灵 丸 不 大 ， 棋 妙子 无 多 ， 程 序 也 是 这 样 ， 许 多 题 
目的 核心 算法 就 是 容 容 几 行 。 这 可 以 说 是 编程 之 美的 一 种 表现 形式 。 
我 们 面试 就 是 要 寻找 能 体会 到 编程 之 美的 人 。 

另外 ， 我 们 的 这 一 番 对 话 应 该 给 微软 的 技术 面试 做 了 相当 的 “去 神 
秘 化 ”(demystified) 的 工作 。 我 还 要 提醒 同学 们 要 “去 粉丝 化 ”一 一 不 
要 像 粉 丝 追逐 明星 ， 如 果 明 星 不 能 满足 自己 见 一 面 的 要 求 (或 者 其 他 
要 求 ) ， 就 觉得 天 旋 地 转 ， 痛 不 欲 生 。 如 果 你 经 过 努力 ， 仍 然 没有 进 
入 微软 公司 ， 你 并 非 一 无 是 处 ， 天 也 不 会 塌 下 来 。 微 软 公司 不 过 是 很 
多 软件 公司 中 的 一 个 ， 它 要 寻找 “合适 ” 它 条 件 的 员工 ， 这 个 公司 不 合 
适 你 ， 还 有 下 一 个 ， 或 者 干脆 你 自己 开创 一 个 吧 。 
Q: 技术 面试 还 有 什么 特别 的 诀窍 么 ? 
A: 微软 全 球 资深 副 总 裁 ， 亚 洲 研究 院 的 前 任 院 长 沈 向 洋 博 士 经 常 讲 的 
一 句 话 是 “Nothing replaces hard work”， 既 然 同学 们 知道 技术 面试 不 外 


乎 就 是 这 些 类 型 的 题目 ， 那 大 家 就 自己 动手 做 一 遍 好 了 。 如 果实 在 做 
不 出 来 ， 可 以 学 习 《编程 之 美 》 或 其 他 书 上 详细 的 讲解 。 
Q: 我 自己 解 谷 问题 太 慢 了 ， 能 不 能 把 《编程 之 美 》 书 上 的 解法 背 下 
来 ， 这 也 是 一 种 捷径 吧 ? 
A: 有 时 要 小 心 这 样 的 “捷径 ”。 不 怕 你 笑话 ， 我 想起 以 前 考 大 学 的 一 件 
事 儿 。 当 时 有 一 本 很 厚 的 英语 标准 化 考试 模拟 题 ， 不 少 同学 都 买 来 
做 。 另 一 位 同学 从 学 长 那里 得 了 一 本 做 过 的 书 ， 我 们 在 做 题 的 时 候 ， 
他 说 :“ 我 不 用 做 了 ， 我 已 经 有 答案 了 ， 我 平时 看 看 答案 就 行 了 ， 一 样 
的 。” 结 果 高 考 的 时 候 ， 他 的 英语 考 得 很 不 好 。 

所 以 ， 对 于 认为 只 要 买 了 一 本 《编程 之 美 》， 或 者 其 他 宝典 ， 就 
好 像 得 到 了 入 职 捷径 的 同学 ， 我 要 提醒 一 下 : 小 心 这 样 的 捷径 ! 纸 上 
得 来 终 觉 浅 ， 绝 知 此 事 要 躬 行 。 


小 飞 的 总 结 


结束 了 和 研发 经 理 的 几 次 对 话 之 后 ， 小 飞 陷 入 了 深思 。 他 发 现 面 
试 并 不 一 定 是 用 难题 、 偏 题 来 考 倒 人 ， 笔 试 和 面试 考察 的 都 是 自己 在 
编程 、 解 决 问题 、 与 人 合作 等 方面 的 全 面 能 力 。 运 气 和 背 好 的 答案 并 
不 能 帮助 他 解决 所 有 的 问题 。 微 软 公司 花费 很 多 人 力 物 力 来 寻找 合适 
的 人 才 ， 那 自己 如 何 能 展现 能 力 ， 让 伯乐 相 中 ? 他 做 了 如 下 的 总 结 : 

1 知己知彼。 知己 ， 就 是 要 了 解 自 己 的 能 力 、 兴 趣 、 职 业 发 展 方 
向 ; 知 彼 ， 就 是 要 了 解 公司 的 文化 、 战 略 方向 和 择 才 标准 。 

2. 笔试 就 是 基础 ， 用 扎实 的 理解 和 考虑 完备 的 解答 来 征服 阅卷 
者 。 

3. 面试 就 是 探讨 ， 用 续 密 的 代码 和 严密 的 分 析 赢 得 未 来 同事 的 尊 
重 。 思 考 问 题 的 方法 比 结果 重要 ， 面 试 者 会 更 加 在 乎 你 解决 问题 的 思 
考 过 程 。 

4. 你 的 工作 融 是 最 好 的 面试 ， 不 要 把 时 间 花 在 寻找 捷径 和 背诵 丛 
案 上 ， 要 通过 实际 的 工作 和 产品 来 体现 自己 的 水 平 。 


千里 之 行 ， 始 于 足下 ， 要 想 在 入 职 竞 争 中 脱颖而出 ， 自 己 得 先 下 
可 功夫 ， 在 平时 就 要 用 职业 的 标准 来 要 求 自 己 。 他 相信 ， 只 要 自己 付 
出 了 足够 的 努力 ， 就 会 有 收获 一 一 “长 风 破 瀛 会 有 时 ， 直 挂 云 帆 济 沧 
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游戏 之 乐 
一 一 游戏 中 人 碰 到 的 题目 
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究 院 举办 过 几 届 桌 上 足球 (foosball) 公开 赛 ， 第 一 届 的 冠军 是 一 位 
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这 一 章 的 题目 原 计 划 叫 做 *Problem Solving” 运用 所 学 的 知识 解决 问 
题 ， 直 译 为 “问题 解决 "， 甚 为 不 美 。 事 实 上 这 里 面 大 部 分 题目 都 是 和 游戏 
相关 的 ， 因 此 本 章 改 名 为 “游戏 之 乐 "。 这 些 题目 从 游戏 和 作者 平时 遇 到 的 
有 趣 问 题 出 发 ， 向 程序 员 提 出 挑战 。 

个 人 电脑 (PC) 在 蹦 蹦 起 步 的 时 候 ， 就 被 当时 的 主流 观点 视 为 玩具 。 
PC 上 的 确 有 各 种 各 样 的 游戏 ， 电 脑 上 的 游戏 是 给 人 玩 的 ， 如 果 你 愿意 ， 
CPU 也 可 以 让 人 “ 玩 ”。 

笔者 曾经 用 *CPU 使 用 率 ” 这 个 问题 问 了 十 几 个 应 聘 者 ， 一 个 典型 的 模式 


和 人 自 . 

我 : 笔试 考 得 怎么 样 ?发挥 了 多 少 水 平 ? 

答 : 我 不 习惯 在 纸 上 写 程序 ， 平 时 都 在 电脑 上 写 .…… 

我 : 那 你 对 Windows、 操 作 系统 这 些 东 西 熟悉 么 ? 

答 : 那 是 相当 熟悉 ..…… 

我 : 好 ， 那 你 可 否 在 这 笔记 本 电脑 上 帮 有 我 解决 一 个 问题 一 一 让 CPU 的 
使 用 率 划 出 一 条 直线 ， 比 如 就 在 50% 的 地 方 。 

这 个 时 候 可 以 观察 应 聘 者 的 好 几 个 方面 : 

1. 应 聘 者 面 对 这 个 陌生 问题 的 时 候 如 何 开始 分 析 。 

有 人 知道 观察 任务 管理 器 如 何 运行 ， 有 人 在 纸 上 写 写 画 画 ， 有 人 明显 
没有 什么 想法 。 

2. 当 提示 可 以 在 网 上 搜索 资料 时 ， 应 聘 者 如 何 寻找 资料 ， 如 何 学 习 。 

比如 ， 有 一 位 学 生 很 快 地 用 快捷 键 在 下 中 打开 了 几 个 Tab 窗 口 ， 然 后 每 
个 窗口 输入 不 同 的 搜索 关键 字 。 当 我 提示 在 MSDN 上 查找 一 些 函数 的 时 
候 ， 有 些 人 根本 不 知道 MSDN 网 站 应 该 怎么 用 。 有 些 人 反复 读 了 函数 的 说 
明 ， 仍 不 得 其 解 。 

3. 在 电脑 上 是 怎么 写 程 序 ， 怎 么 调试 程序 的 。 

有 人 能 很 娴熟 地 使 用 C/C# 的 各 种 语言 特性 ， 很 快 地 写 出 程序 ， 有 人 瑟 
的 程序 编译 了 好 几 次 都 不 能 通过 ， 对 编译 错误 束手无策 。 程 序 第 一 次 运行 
的 时 候 ， 任 务 管理 器 的 CPU 使 用 率 不 按 预 想 的 轨道 运行 ， 这 时 候 有 人 就 十 
分 怖 乱 ， 在 程序 中 瞎 改 一 通 ， 和 希望 能 “ 蒙 ?对 。 有 人 则 有 条 理 地 分 析 ， 最 后 
找到 并 解决 问题 。 

我 想 ，45 分 钟 下 来 ， 应 聘 者 的 思考 能 力 、 学 习 能 力 、 技 术 能 力 如 何 ， 
应 该 很 清楚 了 。 行 还 是 不 行 ， 双 方 都 明白 了 。 


这 一 章 的 其 他 题目 大 多 和 游戏 有 关 ， 同 学 们 在 玩 “ 空 当 接龙 “俄罗斯 
方块 "， 甚 至 “魔兽 ”的 时 候 ， 有 没有 动 过 好 奇 心 一 一 这 个 程序 为 什么 这 么 
酷 ， 如 果 是 我 来 写 ， 应 该 怎么 做 ”有 没有 把 好 奇 心 转化 为 行动 ? 

喜欢 玩 电 脑 、 会 玩 电 脑 的 人 ， 也 会 运用 电脑 解决 实际 问题 ， 这 也 是 我 
们 要 找 的 人 才 。 


1.1 让 CPU 占用 率 曲线 听 你 指挥 


写 一 个 程序 ， 让 用 户 来 决定 windows 任 务 管理 器 (Task Manager) 的 
CPU 占用 率 。 程 序 越 精简 越 好 ， 计 算 机 语言 不 上限。 例如 ， 可 以 实现 下 面 三 
种 情况 : 

1. CPU 的 占用 率 固 定 在 50% ， 为 一 条 直线 ; 

2. CPU 的 占用 率 为 一 条 直线 ， 但 是 具体 占用 率 由 命令 行 参 数 决定 ( 参 
数 范围 1~100) ; 

3. CPU 的 占用 率 状 态 是 一 个 正弦 曲线 。 

分 析 与 解法 2 

有 一 名 学 生 写 了 如 下 的 代码 : 

while (true) 
人 


1 ++; 


else 


然后 她 就 陷入 了 理 舌 思索 : else 干 什么 呢 ? 怎么 才能 让 电脑 不 做 事情 
呢 ? CPU 使 用 率 为 0 的 时 候 ， 到 底 是 什么 东西 在 用 CPU?” 另 一 名 学 生花 了 很 


多 时 间 构 想 如 何 “ 深 入 内 核 ， 以 控制 CPU 占 用 率 ” 一 一 可 是 事情 真 的 有 这 么 复 
杂 么 ? 


MSRA IEG (Microsoft Research Asia, Innovation Engineering Group) 
的 一 些 实习 生 写 了 各 种 解法 ， 他 们 写 的 简单 程序 可 以 达到 如 图 1-1 所 示 的 效 
末 。 


Handie 19329 Tota 3 和 4 
Thread 591 Avalable 272144 
Processe 51 System Cache 357688 
C 3rOe emel Me 
Tota 712936 Tota 89972 
Limit 2393708 Paged 70872 
Peak 95212 Nonpaged 1910( 
Processes: 51 CPU Usage: 2% Commit Charge: 696M § 2441M 


图 1-1 ”编程 控制 CPU 占 用 率 呈 现 正弦 曲线 形态 


看 来 这 并 不 是 不 可 能 完成 的 任务 。 让 我 们 仔细 地 回想 一 下 写 程序 时 曾 
经 碰 到 的 问题 ， 如 果 我 们 不 小 心 写 了 一 个 死 循 环 ，CPU 占 用 率 就 会 跳 到 最 
高 ， 并 且 一 直 保 持 在 100%。 我 们 也 可 以 打开 任务 管理 器 2， 实 际 观测 一 下 
它 是 怎样 变动 的 。 凭 肉眼 观察 ， 它 大 约 是 1 秒 钟 更 新 一 次 。 一 般 情况 下 ， 
CPU 使 用 率 会 很 低 。 但 是 ， 当 用 户 运 行 一 个 程序 ， 执 行 一 些 复杂 操作 的 时 
候 ，CPU 的 使 用 率 会 急剧 升 高 。 当 用 户 晃 动 鼠 标 时 ，CPU 的 使 用 率 也 有 小 
幅度 的 变化 。 

那 当 任务 管理 器 报告 CPU 使 用 率 为 0 的 时 候 ， 谁 在 使 用 CPU 呢 ? 通过 任 
务 管理 器 的 “进程 (Process) ”一 栏 可 以 看 到 ，System Idle Process 占 用 了 
CPU 空 内 的 时 间 一 一 这 时 候 大 家 该 回忆 起 在 “操作 系统 原理 ”这 门 课 上 学 到 的 
一 些 知识 了 吧 。 系 统 中 有 那么 多 进程 ， 它 们 什么 时 候 能 “| 闪 下 来 * 呢 ? 答案 
很 简单 ， 这 些 程序 或 在 等 待 用 户 的 输入 ， 或 者 在 等 待 某 些 事件 的 发 生 s， 或 
者 主动 进入 休眠 状态 2。 


在 任务 管理 器 的 一 个 刷新 周期 内 ，CPU 忙 (执行 应 用 程序 ) 的 时 间 和 
刷新 周期 总 时 间 的 比率 ， 就 是 CPU 的 占用 率 ， 也 就 是 说 ， 任 务 管 理 器 中 显 
示 的 是 每 个 刷新 周期 内 CPU 占用 率 的 统计 平均 值 。 因 此 ， 我 们 可 以 写 一 个 
程序 ， 让 它 在 任务 管理 器 的 刷新 期 间 内 一 会 儿 忙 ， 一 会 儿 闲 ， 然 后 通过 调 
节 忙 了 闲 的 比例 ， 就 可 以 控制 任务 管理 器 中 显示 的 CPU 占 用 率 。 

[解法 一 】 简 单 的 解法 

要 操纵 CPU 的 使 用 率 曲 线 ， 就 需要 使 CPU 在 一 段 时 间 内 (根据 Task 
Manager 的 采样 率 ) 跑 busy 和 idle 两 个 不 同 的 循环 (loop) ， 从 而 通过 不 同 的 
时 间 比 例 ， 来 调节 CPU 使 用 率 。 

Busy loop 可 以 通过 执行 空 循环 来 实现 ，idle 可 以 通过 Sleep() 来 实现 。 

问题 的 关键 在 于 如 何 控制 两 个 loop 的 时 间 ， 我 们 先 试验 一 下 Sleep 一 段 
时 间 ， 然 后 循环 n 次 ， 估 算 n 的 值 。 

那么 对 于 一 个 空 循环 forG 二 0; i<n; i++); 又 该 如 何 来 估算 这 个 最 合适 的 
n 值 呢 ? 我 们 都 知道 CPU 执行 的 是 机 器 指令 ， 而 最 接近 于 机 器 指令 的 语言 是 
汇编 语言 ， 所 以 我 们 可 以 先 把 这 个 空 循环 简单 地 写成 如 下 汇编 代码 后 再 进 
行 分 析 : 

Sr ;将 i 置 入 dx 寄存 器 

inc dx :将 dx 寄存 器 加 1 

mov i dx ;将 dx 中 的 值 赋 回 i 

cmp in ;比较 和 n 

jl loop ;二 小 于 n 时 则 重复 循环 

假设 这 段 代码 要 运行 的 CPU 是 P4 2.4Ghz (2.4*10 的 9 次 方 个 时 钟 周期 每 
秒 ) 。 现 代 CPU 每 个 时 钟 周期 可 以 执行 两 条 以 上 的 代码 ， 那 么 我 们 就 取 平 
均值 两 条 ， 于 是 让 (2400000000*2) /5 三 960000000 (循环 秒 ) ， 也 就 是 
说 CPU1 秒 钟 可 以 运行 这 个 空 循环 960000000 次 。 不 过 我 们 还 是 不 能 简单 地 
将 n= 二 60000000， 然 后 Sleep 〈1000) 了 事 。 如 果 我 们 让 CPU 工作 1 秒 钟 ， 然 后 
休息 1 秒 钟 ， 波 形 很 有 可 能 就 是 锯齿 状 的 一 一 先 达 到 一 个 峰值 〈>50%) ， 
然后 跌 到 一 个 很 低 的 占用 率 。 

我 们 尝试 着 降低 两 个 数量 级 ， 令 n= 二 9600000， 而 睡眠 时 间 相 应 改 为 10 
毫秒 (Sleep(10)) 。 用 10 毫 秒 是 因为 它 不 大 也 不 小 ， 比 较 接近 Windows 的 调 
度 时 间 片 。 如 果 选 得 太 小 (比如 1 毫秒 ) ， 则 会 造成 线程 频繁 地 被 唤醒 和 挂 


起 ， 无 形 中 又 增加 了 内 核 时 间 的 不 确定 性 影响 。 最 后 我 们 可 以 得 到 如 下 代 
但 : 
代码 清单 1-1 


int mainl) 


在 不 断 调 整 9600000 的 参数 后 ， 我 们 就 可 以 在 一 台 指 定 的 机 器 上 获得 一 
条 大 致 稳定 的 50%CPU 占 用 率直 线 。 

使 用 这 种 方法 要 注意 两 点 影响 : 

1. 尽量 减少 sleep/awake 的 频率 ， 减 少 操 作 系 统 内 核 调 度 程序 的 干扰 。 

2. 尽量 不 要 调用 system call (比如 W/O 这 些 privilege instruction) ， 因 为 
它 也 会 导致 很 多 不 可 控 的 内 核 运行 时 间 ]。 

该 方法 的 缺点 也 很 明显 : 不 能 适应 机 器 差异 性 。 一 旦 换 了 一 个 CPU， 
我 们 又 得 重新 估算 n 值 。 有 没有 办 法 动态 地 了 解 CPU 的 运算 能 力 ， 然 后 自动 
调节 忙 了 闲 的 时 间 比 呢 ? 请 看 下 一 个 解法 。 

【解法 二 】 使 用 GetTickCount0 和 Sleep() 


我 们 知道 GetTickCountO 可 以 得 到 “系统 启动 到 现在 ”所 经 历时 间 的 毫秒 
值 ， 最 多 能 够 统计 到 49.7 天 。 我 们 可 以 利用 GetTickCount0 来 判断 busy loop 
要 循环 多 久 ， 伪 代码 如 下 : 
代码 清单 1-2 


这 两 种 解法 都 是 假设 目前 系统 上 只 有 当前 程序 在 运行 ， 但 实际 上 ， 操 
作 系 统 中 有 很 多 程序 会 同时 执行 各 种 各 样 的 任务 ， 如 果 此 刻 其 他 进程 使 用 
了 10% 的 CPU， 那 我 们 的 程序 应 该 只 能 使 用 40% 的 CPU， 这 样 才 能 达到 
50% 的 效果 。 

怎么 做 呢 ? 这 就 要 用 到 另 一 个 工具 来 帮忙 Perfmon.exeo 

Perfmon 是 从 Windows NT 开始 就 包含 在 windows 管 理工 具 组 中 的 专业 检 
测 工具 之 一 (如 图 1-2 所 示 ) 。Perftmon 可 获取 有 关 操 作 系统 、 应 用 程序 和 人 硬 
件 的 各 种 效能 计数 器 (perf counter) 。Perfmon 的 用 法 相当 直接 ， 只 要 选择 
你 所 要 检测 的 对 象 ( 比 如: 处 理 器 、RAM 或 硬盘 ) ， 然 后 选择 效能 计数 器 

(比如 监视 物理 磁盘 的 平均 队列 长 度 ) 即 可 。 
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图 1-2 ”系统 监视 器 (Perfmon) 


我 们 可 以 写 程 序 来 查询 Perfmon 的 值 ，Microsoft .Net Framework 提 供 了 
PerformanceCounter 这 一 对 象 ， 可 以 方便 地 得 到 当前 各 种 性 能 数据 ， 包 括 
CPU 的 使 用 率 。 例 如 下 面 这 个 程序 一 一 


【解法 三 】 能 动态 适应 的 解法 
代码 清单 1-3 


// C# code 

static void MakeUsage (fioat level) 

{ 
PerformanceCounter p = new PerformanceCounter("Processor", "$ Processor 
Time", " Total"); 


while(true) 
{ 
if(p.NextValue{() > level) 
System.Threading.Thread.Sleep(10) ， 


可 以 看 到 ， 上 面 的 解法 能 方便 地 处 理 各 种 CPU 使 用 率 参数 。 这 个 程序 
可 以 解答 前 面 提 到 的 问题 2。 

有 了 前 面 的 积累 ， 我 们 应 该 可 以 让 任务 管理 器 画 出 优美 的 正弦 曲线 
了 ， 见 下 面 的 代码 。 
【解法 四 】 正弦 曲线 


代码 清单 1-4 


/ C++ Code Sk r | Nera | F 
#include 
#1includ 
#inc | 
t ioub StE = 
st int COUNT 2 
nst double P ] 
t 1t TERVAL 3 
1n t i(int arg TCHAR ar ) 
DWORD bu: panT irray Yy 
DWORD idleSpanTlt | r 
int half ITE L 
double radian = 
forl(int 1 = } 
Us (DWHORD) (ha + (Ss (PI radian) * half ) ) 
ERVAL — 1SYSPa 铺 店 - 
ra 4 
DWORD startTim 
nt SF 
) (true) 
| UNT 
ta = ( Ch nt () 
hilel! TickCount () rtTime) D An ) 
Sleep (idlespa ) 
| t+} 
ret n 


讨论 


如 果 机 器 是 多 CPU， 上 面 的 程序 会 出 现 什 么 结果 ? 如 何在 多 个 CPU 时 
显示 同样 的 状态 ? 例如 ， 在 双核 的 机 器 上 ， 如 果 让 一 个 单线 程 的 程序 死 循 


环 ， 能 让 两 个 CPU 的 使 用 率 达 到 50% 的 水 平 么 ?为 什么 ? 

多 CPU 的 问题 首先 需要 获得 系统 的 CPU 信息 。 可 以 使 用 
GetProcessorInfo() 获 得 多 处 理 器 的 信息 ， 然 后 指定 进程 在 哪 一 个 处 理 器 上 运 
行 。 其 中 指定 运行 使 用 的 是 SetThreadAffinityMask() 冰 数 。 

另外 ， 还 可 以 使 用 RDTSC 指 令 获 取 当 前 CPU 核 心 运行 周期 数 。 

在 x86 平 台 上 定义 函数 : 

inline int64 GetCPUTicCkCOunt() 


rdtsc; 


在 x64 平 台 上 定义 : 
#define GetCPUTickCount() __rdtsc() 

使 用 CallNtPowerInformationAPI 得 到 CPU 频 率 ， 从 而 将 周期 数 转 化 为 毫 
秒 数 ， 例 如 : 
代码 清单 1-5 


PROCESSOR POWER INFORMATION info; 


int64 t end setCPUTickCount (); 
uble millisec = ((Gouble)t end 


(double)t begin})/ (double) info.CurrentMhz; 


RDTSC 指 令 读 取 当 前 CPU 的 周期 数 ， 在 多 CPU 系统 中 ， 这 个 周期 数 在 
不 同 的 CPU 之 间 基 数 不 同 ， 频 率 也 有 可 能 不 同 。 用 从 两 个 不 同 的 CPU 得 到 
的 周期 数 作 计算 会 得 出 没有 意义 的 值 。 如 果 线 程 在 运行 中 被 调度 到 了 不 同 
的 CPU， 就 会 出 现 上 述 情况 。 可 用 SetThreadAffinityMask 避 免 线程 迁移 。 另 
外 ，CPU 的 频率 会 随 系统 供电 及 负荷 情况 有 所 调整 。 


总 结 


能 帮助 你 了 解 当前 线程 进程 二 系统 效能 的 API 大 致 有 以 下 这 些 : 
1. Sleep() 一 一 这 个 方法 能 让 当前 线程 “ 停 * 下 来 。 

2. WaitForSingleObject() 一 一 自己 停 下 来 ， 等 待 某 个 事件 发 生 。 
3. GetTickCount0 一 一 有 人 把 Tick 翻 译 成 * 咬 噶 >， 很 形象 。 


让 你 


4. QueryPerformanceFrequency()、QueryPerformanceCounter() 
访问 到 精度 更 高 的 CPU 数据 。 
5. timeGetSystemTimel() 


是 另 一 个 得 到 高 精度 时 间 的 方法 。 

6. PerformanceCounter 一 一 效能 计数 器 。 

7. GetProcessorInfo()/SetThreadAffinityMask()。 遇 到 多 核 的 问题 怎么 办 
呢 ? 这 两 个 方法 能 够 帮 你 更 好 地 控制 CPU。 

8. GetCPUTickCount()。 想 拿 到 CPU 核 心 运行 周期 数 吗 ? 用 用 这 个 方法 
吧 。 

了 解 并 应 用 了 上 面 的 API， 就 可 以 考虑 在 简历 中 写 上 “精通 Windows” 
Ta 


1.2 中国 象棋 将 籼 问 题 


下 过 中 国 象棋 的 朋友 都 知道 ， 双 方 的 “将 ”和 ”“ 帅 ”相隔 遥远 ， 并 且 它 们 不 
能 照 面 。 在 象棋 残局 中 ， 许 多 高 手 能 利用 这 一 规则 走出 精妙 的 杀 招 。 假 设 
棋盘 上 只 有 “将 "和 “ 帅 ” 二 子 〈 如 图 1-3 所 示 ) (为 了 下 面 叙 述 方便 ， 我 们 约 
定 用 A 表示 “将 ”，B 表 示 “ 帅 ”) : 


10 


图 1-3 


A、B 二 子 被 限制 在 己方 3x3 的 格子 里 运动 。 例 如 ， 在 如 上 的 表格 里 ，A 
被 正方 形 {dio ，fio ，dg ，fg } 包 围 ， 而 B 被 正方 形 {d3 ，fs ，d1 ，f1 } 包 围 。 
每 一 步 ，A、B 分 别 可 以 横向 或 纵向 移动 一 格 ， 但 不 能 沿 对 角 线 移动 。 另 
外 ，A 不 能 面 对 B， 也 就 是 说 ，A 和 B 不 能 处 于 同一 纵向 直线 上 (比如 A 在 dio 
的 位 置 ， 那 么 B 就 不 能 在 di 、d, 以 及 ds ) 。 

请 写 出 一 个 程序 ， 输 出 A、B 所 有 合法 位 置 。 要 求 在 代码 中 只 能 使 用 一 


= 
个 变量 。 


分 析 与 解法 


问题 的 本 身 并 不 复杂 ， 只 要 把 所 有 A、B 互 相 排斥 的 条 件 列 举 出 来 就 可 
以 完成 本 题 的 要 求 。 由 于 本 题 要 求 只 能 使 用 一 个 变量 ， 所 以 必须 首先 想 清 
楚 在 写 代码 的 时 候 ， 有 哪些 信息 需要 存储 ， 并 且 尽 量 高 效率 地 存储 信息 。 
稍微 思考 一 下 ， 可 以 知道 这 个 程序 的 大 体 框架 是 : 
遍历 A 的 位 置 
遍历 B 的 位 置 
判断 &a、B 的 位 置 组 合 是 否 满足 要 求 
妇 果 满足 ， 则 输出 
因此 ， 需 要 存储 的 是 A、B 的 位 置信 息 ， 并 且 每 次 循环 都 要 更 新 。 为 了 
能 够 进行 判断 ， 首 先 需要 创建 一 个 逻辑 的 坐标 系统 ， 以 便 检 测 A 何 时 会 面 对 
B。 这 里 我 们 想到 的 方法 是 用 1~9 的 数字 ， 按 照 行 优先 的 顺序 来 表示 每 个 格 
点 的 位 置 (如 图 1-4 所 示 ) 。 这 样 ， 只 需要 用 模 余 运算 就 可 以 得 到 当前 的 列 
号 ， 从 而 判断 A、B 是 否 互 斥 。 


1 2 3 
5 6 


8 9 


图 1-4 ”用 1~9 的 数字 表示 A、B 的 坐标 


第 二 ， 题 目 要 求 只 用 一 个 变量 ， 但 是 我 们 却 要 存储 A 和 B 两 个 子 的 位 置 
信息 ， 该 怎么 办 呢 ? 

可 以 先 把 已 知 变量 类 型 列举 一 下 ， 然 后 做 些 分 析 。 

对 于 bool 类 型 ， 估 计 没 有 办 法 做 任何 扩展 了 ， 因 为 它 只 能 表示 true 和 
false 两 个 值 ; 而 byte 或 者 int 类 型 ， 它 们 能 够 表达 的 信息 则 更 多 。 事 实 上 ， 对 
本 题 来 说 ， 每 个 子 都 只 需要 9 个 数字 就 可 以 表达 它 的 全 部 位 置 。 

一 个 8 位 的 byte 类 型 能 够 表达 28 = 二 256 个 值 ， 所 以 用 它 来 表示 A、B 的 位 
置信 息 绰绰有余 ， 因 此 可 以 把 这 个 字 节 的 变量 ( 设 为 b) 分 成 两 部 分 。 用 前 
面 的 4bit 表 示人 A 的 位 置 ， 用 后 面 的 4bit 表 示 B 的 人 位置， 那么 4 个 bit 可 以 表示 16 
个 数 ， 这 已 经 足够 了 。 


问题 在 于 : 如 何 使 用 bit 级 的 运算 将 数据 从 这 一 byte 变 量 的 左边 和 右边 分 
别 存 入 和 读 出 。 

下 面 是 做 法 : 

四 ”将 byte b (10100101) 的 右边 4bit (0101) 设 为 n (0011) : 

首先 清除 b 右 边 的 bits， 同 时 保持 左边 的 bits: 


11110000 (LMASK) 
& 10100101 (8) 


10100000 
然后 将 上 一 步 得 到 的 结果 与 n 做 或 运算 


10100000 (LMASK & 2) 
^00000011 (7) 


10100011 


曙 ”将 byte b (10100101) 左边 的 4bit (1010) 设 为 n (0011) : 
首先 ， 清 除 b 左 边 的 bits， 同 时 保持 右边 的 bits: 


00001111 (RMASK ) 
& 10100101 (8) 
00000101 


现在 ， 把 n 移 动 到 byte 数 据 的 左边 
n<<4=00110000 
然后 对 以 上 两 步 得 到 的 结果 做 或 运算 ， 从 而 得 到 最 终结 果 。 
00000101 (RMASK & 2) 
^00110000 (<< 4) 


00110101 
四 ”得 到 byte 数 据 的 右边 4bits 或 左边 4bits (e.g.10100101 中 的 1010 以 及 
0101) : 
清除 b 左 边 的 bits， 同 时 保持 右边 的 bits 


00001111 (RMASK) 
& 10100101 (8) 


00000101 
清除 b 的 右边 的 bits， 同 时 保持 左边 的 bits 
11110000 (LMASK) 
& 10100101 (8) 


10100000 
将 结果 右 移 4bits 
10100000 >> 4 = 00000101 
最 后 的 挑战 是 如 何在 不 声明 其 他 变量 约束 的 前 提 下 创建 一 个 for 循 环 。 
可 以 重复 利用 lbyte 的 存储 单元 ， 把 它 作为 循环 计数 器 并 用 前 面 提 到 的 存 取 
和 读 入 技术 进行 操作 。 还 可 以 用 宏 来 抽象 化 代码 ， 例 如 : 
for (LSET(b, 1); LGET(b) <= GRIDW * GRIDW; LSET(b, (LGET(b) + 1))) 
【解法 一 】 
代码 清单 1-6 


#define HALF BITS LENGTH 4 

// 这 个 值 是 记忆 存储 单元 长 度 的 一 半 ， 在 这 道 题 里 是 4bit 

#define FULLMASK 255 

// 这 个 数字 表示 一 个 全 部 bit 的 mask， 在 二 进 制 表示 中 ， 它 是 11111111。 
#define LMASK (FULLMASK << HALF BITS LENGTH) 

// 这 个 宏 表 示 左 bits 的 mask， 在 二 进 制 表 示 中 ， 它 是 11110000。 
#define RMASK (FULLMASK >> HALF BITS LENGTH) 

// 这 个 数字 表示 右 bits 的 mask， 在 二 进 制 表 示 中 ， 它 表示 00001111，。 
#define RSET(b, n) (b = ((LMASK & b) ^ n)) 

// 这 个 宏 ， 将 b 的 右边 设置 成 n 

#define LSET(b, n) (b = ((RMASK & b) ^ (n << HALF BITS LENGTH))) 
// 这 个 宏 ， 将 b 的 左边 设置 成 n 

#0define RGET(b) (RMASK & b) 

// 这 个 宏 得 到 b 的 右边 的 值 

#define LGET(b) ((LMASK & b) >> HALF BITS LENGTH) 

// 这 个 宏 得 到 b 的 左边 的 值 

#define GRIDWR 3 

// 这 个 数字 表示 将 种 移动 范围 的 行 宽度 ， 

#include <stdio.h> 

#define HALF BITS LENGTH 4 

fcdefine FULLMASK 255 

#define LMASK (FULLMASK << HALF BITS LENGTH) 

#define RMASK (FULLMASK >> HALF BITS LENGTH) 

#cdefine RSET(b, n) (b = ((LMASK & b) ^ n)) 

#define LSET(b, n) (b = ((RMASK & b) “~ (n << HALF BITS LENGTH))) 
#define RGET(b) (RMASK & b) 

#define LGET(b) ((LMASK & b) >> HALF BITS LENGTH) 
#define GRIDW 3 


int main{) 
{ 
unsigned char b; 
for(LSET(b, 1); LGET(b) <= GRIDW * GRIDW; LSET(b, (LGET{b) + 1))) 
for {RSET(b, 1); RGET(b) <= GRIDW * GRIDW RSET(b, (RGET(b) + 1))) 
if (LGET(b) $ GRIDW != RGET(b) § GRIDW) 
printf ("A = %d, B = %d\n", LGET(b), RGET(b)); 


return 0; 
} 


【输出 】 
格子 的 位 置 用 N 来 表示 ，N 二 1，2，...，8，9， 依 照 行 优先 的 顺序 ， 如 
图 1-5 所 示 : 


(A) 的 格子 


和 将 扩 
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次 
所 
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图 1-5 


A 王 7，B= 三 3 


A 王 4，B= 三 3 


A 王 7， 了 三 


A 王 4，B 三 


A 王 8，B= 三 1 


A 王 D，B 三 1 


A 王 8，B 王 3 


A 三 5, B= 三 3 


A 王 8，B= 三 4 


A 王 D，BB 三 4 


5， 


A 王 9，B= 三 1 


A 王 6，B= 三 1 


A 王 9，B 王 2 


A 王 6，B 王 2 


A 三 3，B= 三 5 A 王 6，B= 三 5 A 王 9，B= 三 5 
A 王 3，B= 三 7 A 王 6，B 王 7 A 王 9，B 三 7 
A 三 3，B= 三 8 A 王 6，B= 三 8 A 王 9，B 王 8 


考虑 了 这 么 多 因素 ， 总 算得 到 了 本 题 的 一 个 解法 ， 但 是 MSRA 里 却 有 人 
说 ， 下 面 的 一 小 段 代 码 也 能 达到 同样 的 目的 : 


BYTE i = 81; 
while(i--) 


{ 
if(i / 9% 3 == i%9 % 3) 
continue; 
printf (As Sd Bp = SANn 4d 9 9 
} 


但 是 很 快 又 有 另 一 个 人 说 他 的 解法 才 是 效率 最 高 的 : 
代码 清单 1-7 


Strwet 4 
unsigned char a:4; 
unsigned char b:4; 


t ri(1L6a 二 1 < 三 沪 1 , 己 + 十 ) 
(i.b = i.b <= 9 i .D+ 二 ) 
LE == i.b 3) 
printf (“A = $d, B = %d\n”, i.a, i.b); 


读者 能 自己 证 明 一 下 么 ? 。 


1.3 ”一 操 烙 饼 的 排序 


星期 五 的 晚上 ， 一 帮 同 事 在 希 格 玛 大 厦 附 近 的 “硬盘 酒吧 ”多 喝 了 几 
杯 。 程 序 员 多 喝 了 几 杯 之 后 谈 什 么 呢 ? 自然 是 算法 问题 。 有 个 同事 说 : 

“我 以 前 在 餐馆 打工 ， 顾 客 经 常 点 非常 多 的 烙 饼 。 店 里 的 饼 大 小 不 一 ， 
我 习惯 在 到 达 顾 客 饭桌 前 ， 把 一 操 饼 按照 大 小 次 序 摆好 一 一 小 的 在 上 面 ， 
大 的 在 下 面 。 由 于 我 一 只 手 托 着 盘子 ， 只 好 用 另 一 只 手 ， 一 次 抓 住 最 上 面 
的 几 块 饼 ， 把 它们 上 下 颠倒 个 个 儿 ， 反 复 几 次 之 后 ， 这 操 烙 饼 就 排 好 序 
了 。 

我 后 来 想 ， 这 实际 上 是 个 有 趣 的 排序 问题 : 假设 有 n 块 大 小 不 一 的 烙 
饼 ， 那 最 少 要 翻 几 次 ， 才 能 达到 最 后 大 小 有 序 的 结果 呢 ? 

你 能 否 写 出 一 个 程序 ， 对 于 n 块 大 小 不 一 的 烙 饼 ， 输 出 最 优化 的 翻 饼 过 
程 呢 ? 
分 析 与 解法 

这 个 排序 问题 非常 有 意思 ， 首 先 我 们 要 弄 清 楚 解决 问题 的 关键 操作 
一 一 “ 单 手 每 次 抓 几 块 饼 ， 全 部 颠倒 ”。 

具体 参看 图 1-6: 


1 8 


2 © 


3 | 
图 1-6 烙 饼 的 翻转 过 程 


每 次 我 们 只 能 选择 最 上 方 的 一 堆 饼 ， 一 起 翻转 。 而 不 能 一 张 张 地 直接 
抽出 来 ， 然 后 进行 插入 ， 也 不 能 交换 任意 两 块 饼 子 。 这 说 明基 本 的 排序 办 
法 都 不 太 好 用 。 那 么 怎么 把 这 n 个 烙 饼 排 好 序 呢 ? 

由 于 每 次 操作 都 是 针对 最 上 面 的 饼 ， 如 果 最 底层 的 饼 已 经 排序 ， 那 我 
们 只 用 处 理 上 面 的 n 一 1 个 烙 饼 。 这 样 ， 我 们 可 以 再 简化 为 n 一 2、n 一 3， 直 
到 最 上 面 的 两 个 饼 排 好 序 。 


【解法 一 】 


我 们 用 图 1-7 演 示 一 下 ， 为 了 把 最 大 的 烙 饼 摆 在 最 下 面 ， 我 们 先 把 最 上 
面 的 烙 饼 和 最 大 的 烙 饼 之 间 的 烙 饼 翻转 (1~4 之 间 ) ， 这 样 ， 最 大 的 烙 饼 
就 在 最 上 面 了 。 接 着 ， 我 们 把 所 有 烙 饼 翻转 〈4~5 之 间 ) ， 最 大 的 烙 饼 就 
摆 在 最 下 面 了 。 
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图 1-7 ”两 次 翻转 烙 饼 ， 调 整 最 大 的 烙 饼 到 最 底 端 


之 后 ， 我 们 对 上 面 n 一 1、n 一 2 个 饼 重 复 这 个 过 程 就 可 以 了 。 

那么 ， 我 们 一 共 需 要 多 少 次 翻转 才能 把 这 些 烙 饼 给 翻转 过 来 呢 ? 

首先 ， 经 过 两 次 翻转 可 以 把 最 大 的 烙 饼 翻 转 到 最 下 面 。 因 此 ， 最 多 需 
要 把 上 面 的 n 一 1 个 烙 饼 依次 翻转 两 次 。 那 么 ， 我 们 至 多 需要 2 (n 一 1) 次 翻 
转 就 可 以 把 所 有 烙 饼 排 好 序 《因为 第 二 小 的 烙 饼 排 好 的 时 候 ， 最 小 的 烙 饼 
已 经 在 最 上 面 了 ) 。 

这 样 看 来 ， 单 手 翻转 的 想法 是 肯定 可 以 实现 的 。 我 们 进一步 想 想 怎 么 
减少 翻转 烙 饼 的 次 数 吧 。 

怎样 才能 通过 程序 来 搜索 到 一 个 最 优 的 方案 呢 ? 

首先 ， 通 过 每 次 找 出 最 大 的 烙 饼 进行 翻转 是 一 个 可 行 的 解决 方案 。 那 
么 ， 这 个 方案 是 最 好 的 一 个 吗 ? 考虑 这 样 一 种 情况 ， 假 如 这 堆 烙 饼 中 有 好 
几 个 不 同 的 部 分 相对 有 序 ， 任 直觉 来 猜想 ， 我 们 可 以 先 把 小 一 些 的 烙 饼 进 
行 翻转 ， 让 其 有 序 。 这 样 会 比 每 次 翻转 最 大 的 烙 饼 要 更 快 。 

既然 如 此 ， 有 类 似 的 方案 可 以 达到 目的 吗 ? 比如 说 ， 考 虑 每 次 翻转 的 
时 候 ， 把 两 个 本 来 应 该 相 邻 在 烙 饼 尽 可 能 地 换 到 一 起 。 这 样 ， 当 所 有 的 烙 
饼 都 换 到 一 起 之 后 ， 实 际 上 就 是 完成 排序 了 。 (从 这 个 意义 上 来 说 ， 每 次 
翻 最 大 烙 饼 的 方案 实质 上 就 是 每 次 把 最 大 的 和 次 大 的 交换 到 一 起 。) 

在 这 样 的 基础 之 上 ， 本 能 的 一 个 想法 就 是 穷 举 。 只 要 穷 举 出 所 有 可 能 
的 交换 方案 ， 那 么 ， 我 们 一 定 能 够 找到 一 个 最 优 的 方案 。 


进行 实现 了 。 可 以 从 不 同 的 翻转 策略 开始 ， 比 如 说 第 一 次 先 翻 最 小 的 ， 然 
后 递归 把 所 有 的 可 能 全 部 翻转 一 遍 。 这 样 ， 最 终 肯 定 是 可 以 找到 一 个 解 
的 。 


但 是 ， 既 然 是 递归 就 一 定 有 退出 的 条 件 。 在 这 个 过 程 中 ， 第 一 个 退出 
的 条 件 肯定 是 所 有 的 烙 饼 已 经 排 好 序 。 那 么 ， 有 其 他 的 吗 ? 如 果 大 家 仔细 
想 想 就 会 发 现 到 ， 既 然 2 (n 一 1) 是 一 个 最 多 的 翻转 次 数 。 如 果 在 算法 中 ， 
需要 翻转 的 次 数 多 于 2 (n 一 1) ， 那 么 ， 我 们 就 应 该 放弃 这 个 翻转 算法 ， 直 
接 退 出 。 这 样 ， 就 能 够 减少 翻转 的 次 数 。 

从 另外 一 个 层面 上 来 说 ， 既 然 这 是 一 个 排序 问题 。 我 们 也 应 该 利用 到 
排序 的 信息 来 进行 处 理 。 同 样 ， 在 翻转 的 过 程 中 ， 我 们 可 以 看 看 当前 的 烙 
饼 数 组 的 排序 情况 如 何 ， 然 后 利用 这 些 信息 来 帮助 减少 翻转 次 数 的 判断 过 
程 。 

下 面 是 在 前 面 讨论 的 基础 之 上 形成 的 一 个 粗略 的 搜索 最 优 方案 的 程 
序 : 
代码 清单 1-8 


Fin de stdio.h> 
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A/ 


// 输出 烙 饼 具体 翻转 的 次 数 
/1 


void Output {() 


{ 


} 


for(lint i = 0; i < m nMaxSwap; i++) 
{ 

printf("%®d ", m arrSwap[i]); 
} 


printf{("\n |Search Times| : ®%d\n", m nSearch); 
printf{"Total Swap times = $%d\n"; m nMaxSwap);? 


Private: 


// 
// 初始 化 数组 信息 
// @param 
// pcakeArray ”存储 烙 饼 索引 数组 
7/ ncakecnt 烙 饼 个 数 
/1/ 
void Init(int* pCakeArray, int nCakeCnt) 
{ 
Assert (pCakeArray != NULL); 
Assert (nCakeCnt > 0D); 


m nCakeCnt = n; 


/7 初始 化 烙 饼 数组 
m CakeArray = new int{[m nCakeCnt]; 
Assert (m CakeArray != NULL); 
for(lint i = 0; i < m nCakeCnt; i++) 
{ 
m CakeArray[il] = pCakeArray[il]; 
} 


1/ 设置 最 多 交换 次 数 信息 


m nMaxSwap = UpBound{(m nCakeCnt); 


1/ 初始 化 交换 结果 数组 
m SwapArray = new int[m nMaxSwap]; 
Assert(m SwapArray {= NULL); 


/7 初始 化 中 间 交 换 结果 信息 
m ReverseCakeArray = new int[m ncakeCnt]; 
for(li = 0; i < m nCakeCnt; i++) 
{ 

m ReverseCakeArray[il] = m CakeArray[i]; 
} 


m ReverseCakeArraySwap = new int[m nMaxSwap]; 


XR 

// 寻找 当前 翻转 的 上 界 

/1 

/1 

int UpBound(int ncCakeCnt) 
{ 


return nCakeCnt*2; 


} 


/1 
// 寻找 当前 翻转 的 下 界 
1 
// 


int LowerBound(lint* pCakeArray, int nCakeCnt) 


{ 


nt Er Et Ss 


/7 根据 当前 数组 的 排序 信息 情况 来 判断 最 少 需要 交换 多 少 次 
for(lint i = 1; i < ncakecnt; I++) 
{ 

// 判断 位 置 相 邻 的 两 个 烙 饼 ， 是 否 为 尺寸 排序 上 相 邻 的 


t = pCakeArray[i] 一 pCakeArray[i-1]; 
if({t == 1) || {t == -1)) 


return ret? 


} 


// 排序 的 主 函数 


void Search{int step) 


{ 


int i, nEstimate; 


m nSearcht++; 


// 估算 这 次 搜索 所 需要 的 最 小 交换 次 数 


nEstimate = LowerBound (m ReverseCakeArray, m nCakeCnt); 
if{step + nEstimate > m nMaxSwap) 
return; 


// 如 果 已 经 排 好 序 ， 即 翻转 完成 ， 输 出 结果 
if(lIsSsSorted(m ReverseCakeArray, m nCcakeCnt)) 
{ 

if(step < m nMaxSwap) 

{ 


m nMaxSwap = step; 


for{i = 0; i < m nMaxSwap; i++) 
m arrSwap[i] = m ReverseCakeArraySwapl[il]; 
} 
return; 
} 
/7 递归 进行 翻转 
for{i = 1; i < m nCcakeCnt; i++) 


{ 
Revert (0, i); 
m ReverseCakeArraySwap[step] = 工 ; 
Search(step + 1); 
Revert (0, i); 


} 


EA 
/1 truse : 已 经 排 好 序 
7/ false : 未 排序 
/1 
bool IsSorted{(int* pCakeArray, int nCakeCnt) 
{ 
forl(lint 1i1 = 1i; i < nCcakeCnt; i++) 
{ 
if(pCakeArray[i-1] > pCakeArray[i]) 
{ 


return false; 


} 


return true;? 


COL‘\L 


当 烙 饼 不 多 的 时 候 ， 我 们 已 经 可 以 很 快 地 找 出 最 优 的 翻转 方案 。 

我 们 还 有 办 法 来 对 这 个 程序 进行 优化 ， 使 得 能 更 快 地 找 出 最 优 方案 
吗 ? 

我 们 已 经 知道 怎么 构造 行 的 翻转 方案 ， 所 以 最 优 的 方案 肯定 不 
会 比 这 个 差 。 > (UpperBound) ， 就 是 说 ， 我 们 
感 兴趣 的 最 优 方案 最 差 也 就 是 我 们 刚 构 造 出 来 的 方案 了 。 如 果 我 们 能 够 找 
到 一 个 更 好 的 构造 方案 ， 我 们 的 搜索 空间 就 会 继续 缩小 ， 因 为 我 们 一 开始 
就 设 m_nMinSwap 为 UpperBound， 而 程序 中 有 一 个 剪 枝 : 

nNEstimate = LowerBound(m tArr, m n); 


if(step + nEstimate > m nMinSwap) 
return; 


m_nMinSwap 越 小 ， 那 么 这 个 剪 枝条 件 就 越 容易 满足 ， 更 多 的 情况 就 不 
需要 再 去 搜索 。 当 然 ， 程 序 也 就 能 更 快 地 找 出 最 优 方案 。 

仔细 分 析 上 面 的 剪 枝条 件 ， 在 到 达 m_tArr 状 态 之 前 ， 我 们 已 经 翻转 了 
step 次 ，nEstimate 是 在 当前 这 个 状态 我 们 至 少 还 要 翻转 多 少 次 才 全 
数 。 如果 step 十 nEstimate 大 于 m_nMinSwap， 也 就 说 明 从 当前 状态 继 


去 ，m_nMinSwap 次 我 们 也 不 能 排 好 所 有 烙 饼 。 那 么 ， 当 然 就 没有 必要 再 继 
续 了 。 因 为 继续 下 去 得 到 的 方案 不 可 能 比 我 们 已 经 找到 的 好 。 

显然 ， 如 果 nEstimate 越 大 ， 剪 校 条 件 越 容易 被 满足 。 而 这 正 是 我 们 希 
望 的 。 

结合 上 面 两 点 ， 我 们 希望 UpperBound 越 小 越 好 ， 而 下 界 
(LowerBound) 越 大 越 好 。 假 设 如 果 有 神仙 指点 ， 你 只 要 告诉 神仙 你 当前 
的 状态 ， 他 就 能 告诉 你 最 少 需 要 多 少 次 翻转 。 这 样 的 话 ， 我 们 可 以 花费 O 
(N* ) 的 时 间 得 到 最 优 的 方案 。 但 是 ， 现 实 中 ， 没 有 这 样 的 神仙 。 我 们 只 
能 尽 可 能 地 减 小 UpperBound， 增 加 LowerBound， 从 而 减少 需要 搜索 的 空 
间 。 

利用 上 面 的 程序 ， 做 一 个 简单 的 比较 。 

对 于 一 个 输入 ， 10 个 烙 饼 ， 从 上 到 下 ， 烙 饼 半径 分 别 为 3， 勾 5 1 ， 0， 
5，4，9，8，7，0。 对 应 上 面 程序 的 输入 为 : 

10 

3216549870 


如 果 LowerBound 在 任何 状态 都 为 0， 也 就 是 我 们 太 懒 了 ， 不 想 考 虑 那么 
多 。 当 然 任 意 状 态 下 ， 你 至 少 需要 0 次 翻转 才能 排 好 序 。 这 样 ， 上 面 的 程序 
Search 孙 数 被 调用 了 575225200 次 。 

但 是 如 果 把 LowerBound 稍 微 改 进 一 下 〈 如 上 面 程序 中 所 计算 的 方法 估 
计 ) ， 程 序 则 只 需要 调用 172126 次 Search 函 数 便 可 以 得 到 最 优 方案 : 

6 

486849 


程序 中 的 下 界 是 怎么 估计 出 来 的 呢 ? 

每 一 次 翻转 我 们 最 多 使 得 一 个 烙 饼 与 大 小 跟 它 相 邻 的 烙 饼 排 到 一 起 。 
如 果 当 前 状态 n 个 烙 饼 中 ， 有 m 对 相 邻 的 烙 饼 它 们 的 半径 不 相 邻 ， 那 么 我 们 
至 少 需要 m 次 才能 排 好 序 。 

从 上 面 的 例子 ， 大 家 都 会 发 现 改 进 上 界 和 下 界 ， 好 处 可 不 少 。 我 想 不 
用 多 说 ， 大 家 肯定 想 继续 优化 上 界 和 下 界 的 估计 吧 。 

除了 上 界 和 下 界 的 改进 ， 还 有 什么 办 法 可 以 提高 搜索 效率 吗 ? 如 果 我 
们 翻 了 若干 次 之 后 ， 又 回 到 一 个 已 经 出 现 过 的 状态 ， 我 们 还 值得 继续 从 这 
个 状态 开始 搜索 吗 ? 我 们 怎样 去 检测 一 个 状态 是 否 出 现 过 呢 ? 


读者 也 许 不 相信 ， 比 尔 盖 次 在 上 大 学 的 时 候 也 研究 过 这 个 问题 ， 并 且 
发 表 过 论文 。 你 不 妨 跟 盖 淘 的 结果 s 比 比 吧 。 


扩展 问题 


1. 有 一 些 服务 员 会 把 上 面 的 一 摆 饼 子 放 在 自己 头顶 上 (放心 ， 他 们 都 
戴 着 洁白 的 帽子 ) ， 然 后 再 处 理 其 他 饼 子 ， 在 这 个 条 件 下 ， 我 们 的 算法 能 
有 什么 改进 ? 

2. 事实 上 ， 饭 店 的 师傅 经 常 把 烙 饼 烤 得 一 面 非 常 焦 ， 另 一 面 则 是 金黄 
色 。 这 时 ， 服 务 员 还 得 考虑 让 烙 饼 大 小 有 序 ， 并 且 金 黄色 的 一 面 都 要 向 
上 。 这 样 要 怎么 翻 呢 ? 

3. 有 一 次 师傅 烙 了 三 个 饼 ， 一 个 两 面 都 焦 了 ， 一 个 两 面 都 是 金黄 色 ， 
一 个 一 面 是 焦 的 ， 一 面 是 金黄 色 ， 我 把 它们 摆 一 起 ， 只 能 看 到 最 上 面 一 个 
饼 的 上 面 ， 发 现 是 焦 的 ， 问 最 上 面 这 个 饼 的 另 一 面 是 焦 的 概率 是 多 少 ? 

4. 每 次 翻 烙 饼 的 时 候 ， 上 面 的 若干 个 烙 饼 会 被 翻转 。 如 果 我 们 希望 在 
排序 过 程 中 ， 翻 转 烙 饼 的 总 个 数 最 少 ， 结 果 会 如 何 呢 ? 

5. 对 于 任意 次 序 的 n 个 饼 的 排列 ， 我 们 可 以 研究 把 它们 完全 排序 需要 
大 致 多 少 次 翻转 ， 目 前 的 研究 成 果 是 : 

(1) 目前 找到 的 最 大 的 下 界 是 15n/14， 就 是 说 ， 如 果 有 100 个 烙 饼 ， 那 
么 我 们 至 少 需 要 15x100/14 二 108 次 翻转 才能 把 烙 饼 翻 好 一 一 而 且 具 体 如 何 翻 
还 不 知道 。 

(2) 目前 找到 的 最 小 的 上 界 是 (5n 十 5) /3， 对 于 100 个 烙 饼 ， 这 个 上 
界 是 169。 

(3) 任意 次 序 的 n 个 烙 饼 反 转 排 序 所 需 的 最 小 反 转 次 数 被 称 为 第 n 个 烙 
饼 数 ， 现 在 找到 的 烙 饼 数 为 : 


第 14 个 烙 饼 数 P14 还 没有 找到 ， 读 者 朋友 们 ， 能 否 在 吃 烙 饼 之 余 考虑 一 


下 这 个 问题 ? 


1.4 买书 问题 


在 节假日 的 时 候 ， 书 店 一 般 都 会 做 促销 活动 。 由 于 《 哈 利 波 特 》 系 列 
相当 畅销 ， 店 长 决定 通过 促销 活动 来 回馈 读者 。 在 销售 的 《 哈 利 疲 特 》 平 
装 本 系列 中 ， 一 共有 五 卷 ， 用 编号 0，1，2，3，4 来 表示 。 假 设 每 一 卷 单独 
销售 均 需 要 8 欧元 2。 如 果 读 者 一 次 购买 不 同 的 两 卷 ， 就 可 以 扣除 5% 的 费 
用 ， 三 卷 则 更 多 。 假 设 具体 折扣 的 情况 如 下 : 

本 数 折扣 
5% 
10% 


20% 


nn 


a 
如 > LA0 


在 一 份 订单 中 ， 根 据 购买 的 卷 数 以 及 本 书 ， 就 会 出 现 可 以 应 用 不 同 折 
扣 规 则 的 情况 。 但 是 ， 一 本 书 只 会 应 用 一 个 折扣 规则 。 比 如 ， 读 者 一 共 买 
了 两 本 卷 一 ， 一 本 卷 二 。 那 么 ， 可 以 享受 到 5% 的 折扣 。 另 外 一 本 卷 一 则 不 
能 享受 折扣 。 如 果 有 多 种 折扣 ， 和 希望 能 够 计算 出 的 总 额 尽 可 能 的 低 。 

要 求 根据 这 样 的 需求 ， 设 计 出 算法 ， 能 够 计算 出 读者 所 购买 一 批 书 的 
最 低 价格 。 
分 析 与 解法 

怎么 购买 比较 省 钱 呢 ? 第 一 个 感觉 ， 当 然 是 先 优先 考虑 最 大 折扣 ， 然 
后 再 次 之 。 

这 的 确 是 一 个 有 效 的 办 法 。 那 么 这 个 算法 是 不 是 最 省 钱 的 呢 ? 如 果 我 
们 要 买 两 本 第 一 卷 ， 两 本 第 二 卷 ， 两 本 第 三 卷 ， 一 本 第 四 卷 ， 一 本 第 五 
卷 。 

按照 优先 考虑 最 大 折扣 的 策略 ， 我 们 先 买 各 卷 各 一 本 ， 人 花 去 5x8x (1 一 
25%) 三 30， 再 买 第 一 ， 二 ， 三 卷 ， 花 去 3x8x (1 一 10%) 三 21.6， 总 共 
51.6 欧 元 。 但 是 如 果 我 们 换 一 个 策略 ， 先 买 第 一 、 二 、 三 、 四 卷 ， 然 后 再 买 
第 一 、 二 、 三 、 五 卷 ， 那 么 总 共 花 去 2x (4x8x (1 一 20%) 三 51.2 欧 元 。 

从 上 面 我 们 可 以 发 现 ， 这 些 折扣 有 一 定 的 规律 。 在 同样 是 买 8 本 书 的 情 
况 下 ， 选 择 分 别 按照 3 本 和 5 本 ， 以 及 按照 两 个 4 本 的 付 法 ， 费 用 会 不 一 样 。 


也 就 是 说 ， 针 对 这 个 问题 试图 用 贪心 策略 行 不 通 。 
【解法 一 】 

那么 针对 这 种 问题 的 解法 ， 动 态 规划 是 一 个 不 错 的 选择 。 那 么 ， 不 妨 
试 一 下 动态 规划 的 方法 。 

首先 ， 在 使 用 动态 规划 之 前 ， 得 考虑 怎么 表达 购买 中 间 出 现 的 状态 。 
假设 我 们 用 X, 来 表示 购买 第 n 卷 书籍 的 数量 。 如 果 要 买 X 本 第 一 卷 ，X, 本 
第 二 卷 ，X, 本 第 三 卷 ，X, 本 第 四 卷 ，X。 本 第 五 卷 ， 那 么 我 们 可 以 用 (Xi 
，X， ，Xs。 ，X4 ，Xs ) 表示 我 们 要 买 的 书 , 而 F (Xj ，X,，Xs， Xs， Xs 
) 表示 我 们 要 买 这 些 书 需要 的 最 少 花 费 。 

如 果 我 们 要 买 X, 本 第 一 卷 ，X, 本 第 二 卷 ，Xi 本 第 三 卷 ，X 本 第 四 
卷 ，X。 本 第 五 卷 呢 ?是否 需 要 用 F (Xs ，X, ，X1 ，X4 ，X。 ) 来 表示 呢 ? 
其 实 不 难看 出 ， 因 为 各 卷 的 价格 一 样 ， 需 要 的 最 少 花 费 仍 然 等 于 F (Xi ， 
XX 也 就 是 诗 y 下 (XI 3 XX? 六， X43 Xe) 等 价 于 玉 
(Xs ，X, ，X1 ，X4 ，X。) 。 因 此 我 们 没有 必要 区 分 不 同 的 卷 。 那 么 对 于 
所 有 跟 (Xi ，X, ，Xs，X4 ，Xs ) 等 价 的 情况 ， 我 们 用 什么 来 表示 呢 ? F 
全 全 粒 天 有 郊区 六 还 是 性 广 区 3 还 


根据 排列 组 合 的 规则 ， 最 多 有 5! 种 可 选择 的 表示 方法 ， 我 们 可 以 选择 
一 种 特别 的 表示 (Yl ，Y， ，Ys ，Y4 ，Ys ) (其 中 ，Y, 用 来 表示 购买 第 n 
卷 书籍 的 数量 ，Yi ，Y, ，Ys ，Y4 ，Y 是 Xi ，X, ，Xs ，X4 ，Xc 的 重新 
排列 ， 满 足 Y > =Y， ==Y,3 >=Y4 > 二 Ys ) ， 我 们 称 它 为 所 有 跟 (Xi 
，X,，X3 ，X4 ，Xs ) 等 价 的 情况 的 “最 小 表示 ”。 

接 下 来 ， 就 需要 考虑 怎么 把 一 个 大 问题 转化 为 小 一 点 的 问题 。 

假定 要 买 的 书 为 (Y; ，Y, ，Y3 ，Y4 ，Ys ) 。 如 果 第 一 次 考虑 为 5 本 
不 同 卷 付 钱 (当然 这 里 需要 保证 Ys >=1) ， 那 么 剩 下 还 要 再 付 钱 的 书 集合 
为 (Yi 一 1，Y, 一 1，Y3 一 1，Y4 一 1，Ys 一 1) 。 如 果 第 一 次 考虑 买 4 本 不 
同 卷 (Ys >=1) ， 那 么 我 们 接 下 来 还 需要 买 的 书 集合 为 〈Y1 一 1，Y, 一 
1 Yl Ye Yau) 


根据 题 意 ， 只 要 是 不 同 卷 的 书 组 合 起 来 就 能 享受 折扣 ， 至 于 具体 是 哪 
几 卷 ， 并 不 要 求 。 因 此 ， 就 可 以 不 用 考虑 其 他 可 能 比如 (Yj 一 1，Y, 一 1， 
Ys 一 1， Ya 》 Ys 二 和) O 


其 他 同 理 ， 根 据 如 上 的 推理 可 以 得 到 状态 转移 方程 : 
FH, Bb, K, Fi, KF) 


=0 if (HH=B= B=h==0) 
=min { 
Sk TE AR Bl hl if (>=1) 
4x8x (1—-20%) +F (1-1, 18-1, 8B-l1, Fh-1, 1) ， if (>=1) 
Sl=10%Y tr CH ll 1 1 1).3 > 
2x8x (1-5%) 十 太 ( 太 -1 EB-1, $B, ,FF), if (>=1) 
a /ee We if (FH >=1) 


状态 转化 之 后 得 到 的 (Yj 一 1，Y, 一 1，Ys 一 1，Y4 一 1，Ys ) 等 可 能 
不 是 “最 小 表示 ”， 我 们 需要 把 它们 转化 为 对 应 的 最 小 表示 。 比 如 : 

mR 

=min { 
5x8x (1-25%) + (1, 
4x8x (1-20%) 十 书 (1， 
3x8x (1-10%) +F (1, 
分 EC 


8$+ 严 (12 2.2. 2) 


2) ， 此 这 里 不 是 最 小 表示 */ 


jms。 ps jms。 
[eS le 一 -一 
— 


min { 
sw de CEI0 ECL 1 Ld 1):, 
4x RX CT 1 LL1), /# 转换 为 最 小 表示 */ 


SKB 下 90702 s 
SRB CE- FH; 
Sh dl 


从 上 面 的 表示 公式 中 可 以 看 出 ， 整 个 动态 规划 的 算法 需要 耗费 O (Y] 
xY, XY3 xY4 XYs ) 的 空间 来 保存 状态 的 值 ， 所 需要 的 时 间 复 杂 度 也 为 O 
(Yi XY XY RY Ys) 


【解法 二 】 


对 于 上 面 的 算法 ， 时 间 复 杂 度 仍然 很 大 。 那 么 ， 对 于 这 个 问题 还 有 没 
有 别 的 办 法 呢 ? 贪心 策略 是 否 有 办 法 成 功 呢 ? 

该 贪心 策略 会 在 买 5 十 3 本 的 时 候 出 错 。 因 为 

5x8x (1—25%) 十 3x8x (1—10%) >4x8x (1 一 20%) 十 4x8x (1 一 
20%) 。 实 际 上 就 是 说 ， 在 购买 8 本 书 的 情况 下 : 5x259% 十 3x10%<< 
8x20%。 

回 过 头 对 比 一 下 : 

在 小 于 5 本 的 情况 下 ， 直 接 按 折扣 买 就 好 了 : 
So20 
10% 


20% 


25% 


SS 6 


那么 如 果 大 于 5 本 呢 。 
首先 ， 对 于 大 于 5 本 的 情况 ， 我 们 不 应 该 考虑 按 一 本 付 钱 的 情况 ， 因 为 
没有 折扣 。 


本 数 可 能 的 分 解 本 数 对 应 的 折扣 

6 = 447 4x20%+2x5% = 1.1 
= 3+3 3x10%+3x10% = 0.6 
= 2+2+2 6x5% = 0.3 


注 明 : 上 面 的 分 解 并 不 适用 于 所 有 情况 。 我 们 仪 考虑 的 是 理论 上 可 能 
的 最 大 分 法 ， 对 于 不 能 进行 分 解 的 情况 ， 比 如 购买 6 本 卷 一 ， 没 有 办 法 享受 
折扣 ， 因 此 其 折扣 将 小 于 上 述 的 讨论 情况 。 同 样 地 ， 对 于 购买 5 本 卷 一 ，1 
本 卷 二 的 情况 ， 最 多 只 能 享受 一 种 折扣 ， 其 折扣 也 会 小 于 上 述 的 分 解 情 
况 。 对 于 以 下 的 分 解 情况 ， 同 样 适用 。 


本 数 可 能 的 分 解 本 数 对 应 的 折扣 
= 5+2 5x25%+2x5% = 1.35 
= 4+3 4x20%+3x10% = 1.1 
8 =5+3 5x25%+3x10% = 1.55 
= 4+4 4x20%+4x20% = 1.6 
= 3+3+2 6x10%+2x5% = 0.7 
2+2+2+2 8xS% 0.4 
9 = 5+4 5x25% + 4x20% = 2.05 
5+2+2 Sx25%+4x5% = 1.45 
= 4+3+2 4x20%+3x10%+2x5% = 1.2 
= 3+3+3 9x10% = 0.9 
10 =5+5 10x25% = 2.5 
= 4+4+2 8x20%+2x5% = 1.7 
= 4+3+3 4x20%+6x10% = 1.4 
= 2+2+2+2+2 10x5% = 0.5 


由 于 折扣 的 规则 仅 针 对 2 到 5 本 的 情况 。 对 于 大 于 10 本 的 情况 ， 我 们 可 
以 提出 如 下 的 一 个 假设 : 

假设 在 分 解 的 过 程 中 ， 可 以 找到 如 下 的 一 种 分 法 : 可 以 把 10 本 以 上 的 
书籍 分 成 小 于 10 的 多 组 (X11 ，Xi2 ，X13 ，X14 ，X15) ， (X21 ， X22, 
X23 ，X24 ，X25) ... (Xn1 ，Xn2，Xn3，Xn4 ，Xn5 ) ， 并 且 使 得 只 要 把 每 
组 的 最 优 解 相 加 ， 就 可 以 得 到 全 局 的 最 优 解 。 

那么 ， 对 于 大 于 10 的 情况 ， 都 可 以 分 解 为 小 于 10 的 情况 。 

假设 这 样 的 分 法 存在 ， 那 么 就 可 以 按照 小 于 10 的 情况 考虑 求解 。 如 果 
要 买 的 书 为 (Yj ,，Y,， Ys,，Y4， Yc) (其 中 Yj >=Y,>>=Y,>>=Y 
>>=Y。) ， 贪 心 策略 建议 我 们 买 Y。 本 五 卷 的 ，Y 一 Ys 本 四 卷 ，Y, 一 Ys 
本 三 卷 ，Y, 一 Yas 本 两 卷 和 Yi 一 Y, 本 一 卷 。 由 于 贪心 策略 的 反例 ， 我 们 把 
K 本 五 卷 和 K 本 三 卷 重新 组 合成 2xXK 本 四 卷 (K 二 min{Y5，Y3 一 Y4}) 。 结 
果 就 是 我 们 买 Y5 一 K 本 五 卷 的 ，Y 一 Ys 本 四 卷 ，Y, 一 Y 一 K 本 三 卷 ，Y， 
一 Ys 本 两 卷 和 Yi 一 Y, 本 一 卷 (K 二 min{Ys ，Ys 一 Y4 }) 。 比 如 我 们 要 买 3 
本 第 一 卷 ，2 本 第 二 卷 ，6 本 第 三 卷 ，1 本 第 四 卷 和 7 本 第 五 卷 ， 像 前 面 所 说 
的 ， 我 们 要 买 的 书 可 以 用 (7，6，3，2，1) 表示 。 新 的 经 过 调整 的 贪心 策 
略 告诉 我 们 应 该 买 三 本 四 卷 ， 三 本 两 卷 和 一 本 一 卷 。 

那么 这 种 分 法 是 正确 的 吗 ? 有 办 法 证 明 或 者 找到 反例 吗 ? 读者 可 以 直 
接 和 我 们 联系 。 


1.5 ”快速 找 出 故障 机 器 


关心 数据 挖掘 和 搜索 引擎 的 程序 员 都 知道 ， 我 们 需要 很 多 的 计算 机 来 
存储 和 处 理 海量 数据 。 然 而 ， 计 算 机 难免 会 有 硬件 故障 而 导致 网 络 联 系 失 
败 或 死机 。 为 了 保证 搜索 引擎 的 服务 质量 ， 我 们 需要 保证 每 份 数据 都 有 多 
个 备份 。 

为 了 简单 起 见 ， 我 们 假设 一 个 机 器 仅 储存 一 个 标号 为 ID 的 纪录 (假设 
ID 是 小 于 10 亿 的 整数 ) 假设 每 份 数据 保存 两 个 备份 ， 这 样 就 有 两 个 机 器 储 
存 了 同样 的 数据 。 

1. 在 某 个 时 间 ， 如 果 得 到 一 个 数据 文件 ID 的 列表 ， 是 否 能 够 快速 地 找 
出 这 个 表 中 仅 出 现 一 次 的 ID? 

2. 如 果 已 经 知道 只 有 一 台 机 器 死机 (也 就 是 说 只 有 一 个 备份 丢失 ) 
呢 ? 如 果 有 两 台 机 器 死机 呢 〈 假 设 同一 个 数据 的 两 个 备份 不 会 同时 丢 
2 
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[解法 一 】 

这 个 问题 可 以 转化 为 这 样 的 问题 : 有 很 多 的 ID， 其 中 只 有 一 个 ID 出 现 
的 次 数 小 于 2， 其 他 正音 ID 出 现 的 次 数 都 等 于 2， 问 如 何 找到 这 个 次 数 为 1 的 
ID。 

为 了 达到 这 个 目的 ， 最 简单 的 办 法 就 是 直接 遍历 列表 ， 利 用 一 个 数组 
记 下 每 个 ID 出 现 的 次 数 ， 遍 历 完毕 之 后 ， 出 现 次 数 小 于 2 的 ID 就 是 我 们 想 要 
的 结果 。 假 设 有 n 个 ID， 这 个 解法 占用 的 时 间 复 杂 度 为 O(N) ， 空 间 复杂 
度 为 O(N) 。 

时 间 复 杂 度 已 经 相当 理想 ， 但 是 空间 复杂 度 仍 觉 不 够 理想 。 如 果 ID 的 
数量 多 达 几 G 甚 至 几 十 G， 那 么 ， 这 样 的 空间 复杂 度 在 实际 的 运算 中 就 会 市 
来 效率 上 的 问题 。 那 么 ， 是 否 有 办 法 进一步 地 减少 空间 复杂 度 呢 ? 


【解法 二 】 
仔细 思考 一 下 ， 哪 些 数 据 是 我 们 不 必 存 储 的 呢 ? 大 部 分 的 机 器 ID 出 现 
次 数 都 等 于 2， 这 些 ID 的 信息 有 必要 吗 ? 我 们 可 以 利用 这 样 一 个 特性 : ID 出 


现 次数 等 于 2 的 机 器 肯定 不 是 故障 的 机 器 ， 可 以 不 予 考虑 。 因 此 ， 可 以 把 解 
法 1 数组 中 等 于 2 的 元 素 清空 ， 然 后 用 来 存储 下 一 个 机 器 ID 的 出 现 次 数 ， 这 
样 就 可 以 减少 需要 的 空间 。 

具体 方法 如 下 : 遍历 列表 ， 利 用 变 长 数组 记 下 每 个 ID 出 现 的 次 数 ， 每 
次 遇 到 一 个 ID ， 就 向 变 长 数组 中 增加 一 个 元 素 ; 如 果 这 个 ID 出 现 的 次 数 为 
2， 那 么 就 从 变 长 数组 中 删除 这 个 ID ， 最 后 变 长 数组 中 剩 下 的 ID 就 是 我 们 想 
要 的 结果 。 这 个 算法 空间 复杂 度 在 最 好 情况 下 可 以 达到 O (1) ， 在 最 坏 情 
况 下 的 空间 复杂 度 仍然 是 O(N) 。 

【解法 三 】 

虽然 前 面 的 两 个 算法 已 经 达到 了 O (N) ， 并 且 空 间 复杂 度 也 已 经 有 了 
一 定 的 突破 ， 那 么 是 否 有 可 能 进一步 提高 算法 的 性 能 呢 ? 

显然 ， 只 有 两 个 方面 有 可 能 。 一 个 是 从 时 间 复 杂 度 ， 一 个 是 从 空间 复 
杂 度 上 面 。 时 间 复 杂 度 上 面 ， 我 们 可 能 很 难 有 太 大 的 突破 。 因 为 ， 已 经 降 
到 了 O (N) 这 个 规模 了 。 那 么 ， 空 间 复杂 度 呢 ? 

如 果 想 继续 降低 空间 复杂 度 ， 那 么 就 要 据 弃 遍历 列表 计数 这 种 方法 
了 ， 而 需要 考虑 采用 完全 不 同 的 模式 来 计算 。 

如 果 空 间 复杂 度 仍然 在 N 这 个 级 别 ， 其 实 也 没有 降 多 少 。 是 否 可 以 降 到 
常数 级 别 呢 ? 更 加 极端 一 点 ， 是 否 可 能 使 得 空间 复杂 度 降 为 O (1) ， 也 就 
是 说 只 利用 一 个 变量 来 记录 遍历 列表 的 结果 。 

如 果 这 样 的 话 ， 我 们 可 以 把 这 个 变量 写成 : 

x(i) = f(List[0],List[1],… ,List 四) ， 也 就 是 说 这 个 变量 是 已 经 遍历 过 的 列 
表 元 素 的 函数 。 那 么 这 个 函数 需要 满足 的 条 件 就 是 : x_(N) 二 ID_Lost。 也 就 
说 遍历 完整 个 列表 后 ， 这 个 变量 的 值 应 该 等 于 丢失 备份 的 ID。 

这 样 的 话 ， 我 们 需要 做 的 就 是 寻找 合适 的 f。 

显然 ，f 的 形式 肯定 不 只 一 种 。 那 么 ， 我 们 可 以 先 考虑 出 找 出 一 种 可 行 
的 函数 。 对 于 第 一 问 ， 我 们 已 经 知道 ， 列 表 中 仅 有 一 个 ID 出 现 了 一 次 。 那 
么 ， 可 以 考虑 使 用 异 或 关系 来 帮忙 找到 结果 。 

因为 X@X=0 且 X@0=X， 因 此 ， 可 以 同样 把 这 个 关系 应 用 到 构造 这 
个 函数 上 面 。 因 为 ， 正 确 的 机 器 都 会 有 两 个 ID ， 不 正确 的 机 器 只 有 一 个 
ID。 所 以 所 有 ID 的 异 或 值 就 等 于 这 个 仅 出 现 一 次 的 ID (因为 异 或 运算 满足 


交换 律 和 结合 律 ， 其 他 出 现 两 次 的 ID 异 或 完 都 为 0) 。 这 样 我 们 就 使 用 一 次 
遍历 运算 得 到 了 只 有 一 台 故 障 机 器 情况 下 故障 机 器 的 ID。 

因此 ， 就 可 以 使 用 x(D = List[0]@List[11@… @List[ 口 来 作为 结 
值 。 

在 这 样 的 情况 下 ， 时 间 复 杂 度 为 O(N) ， 由 于 只 需要 保存 一 个 运算 结 
果 ， 因 此 空间 复杂 度 为 O (1) 。 

对 于 第 二 问 ， 由 于 有 两 个 ID 仅 出 现 了 一 次 ， 设 它们 为 A 和 B， 那 么 所 有 
ID 的 异 或 值 为 A@B (道理 同上 面 分 析 的 一 样 ) 。 但 是 还 是 无 法 确定 A 和 B 的 
值 。 

因此 ， 可 以 进行 分 类 讨论 : 如 果 A=B， 则 A@B 为 0， 也 就 是 说 丢失 的 
是 同一 份 数据 的 两 个 拷贝 ， 那 就 没有 特别 简单 的 方法 来 找 出 A 和 B 了 。 如 果 
A@B 不 等 于 0， 那 么 这 个 异 或 值 的 二 进 制 中 某 一 位 为 1。 显 然 ，A 和 B 中 有 且 
仅 有 一 个 数 的 这 一 位 上 也 为 1。 

这 样 ， 我 们 就 把 所 有 ID 分 成 两 类 ， 一 类 在 这 位 上 为 1， 另 一 类 这 位 上 为 
0。 那 么 对 于 这 两 类 ID， 每 一 类 分 别 含 有 A 和 B 中 的 一 个 。 那 么 我 们 使 用 两 
个 变量 ， 在 遍历 列表 时 ， 分别 计算 这 两 类 ID 的 异 或 科 ， 即 可 得 到 A 和 PB 的 
值 。 
【解法 四 ] 

解法 三 的 空间 复杂 度 只 有 O (1) ， 时 间 复 杂 度 为 O(N) ， 在 计算 复杂 
度 上 已 经 做 到 了 最 优 。 但 对 于 第 二 问 两 台 机 器 死机 的 情况 ， 只 能 解决 两 台 
故障 机 器 ID 不 同 的 情况 ， 如 果 ID 相 同 则 无 法 解决 。 

那 如 果 需 要 考虑 死机 的 两 台 机 器 ID 可 以 相同 ， 还 有 没有 办 法 解决 呢 ? 
让 我 们 再 回头 仔细 分 析 一 下 这 个 问题 ， 这 个 问题 可 以 抽象 为 : 在 一 个 事先 
预定 的 整数 (ID) 集合 当中 ， 怎 么 样 找 出 其 中 丢失 的 一 个 数 (ID) 或 者 两 
个 数 (ID) ? 

让 我 们 回忆 一 下 以 前 数学 中 的 “不 变量 ”的 概念 ， 就 会 发 现 这 些 所 有 机 
器 ID 的 求 和 是 一 个 固定 的 值 ， 也 就 是 我 们 所 说 的 “不 变量 ”。 或 许 这 个 “不 变 
量 ” 可 以 用 来 解决 我 们 当前 的 问题 。 如 果 只 有 一 台 机 器 死机 ， 相 当 于 我 们 这 
个 ID 集 合 里 面 少 了 一 个 ID， 也 就 是 说 我 们 把 剩 下 的 ID 求 和 和， 和 所 有 ID 的 的 
求 和 (“不 变量 ”) 相差 的 就 是 当前 缺少 的 ID 的 数值 ! 


这 样 我 们 就 得 到 如 下 的 算法 来 解决 这 个 问题 : 预先 计算 并 保存 好 所 有 
ID 的 求 和 〈“ 不 变量 ”” ， 顺 序列 举 当 前 所 有 剩 下 的 ID ， 把 他 们 求 和 ， 然 后 
用 所 有 ID 的 求 和 (“不 变量 *) 减 去 当前 剩 下 所 有 ID 的 和 ， 结 果 就 是 当前 死 
机 的 机 器 ID 的 值 。 由 于 所 有 ID 的 求 和 〈“ 不 变量 ”) 可 以 预先 算 好 ， 而 且 在 
所 有 的 检测 中 只 算 一 次 ， 当 前 算法 的 时 间 复 杂 度 为 O(N) ， 空 间 复杂 度 为 
O (1) ， 和 解法 三 一 样 是 计算 复杂 度 最 优 的 算法 。 

对 于 第 二 问 ， 我 们 考虑 所 有 的 情况 ， 即 两 个 ID 可 以 不 同 也 可 以 相同 。 
这 时 候 就 相当 于 在 ID 的 集合 里 面 丢 失 了 两 个 ID。 用 上 面 的 同样 方法 我 们 只 
能 得 到 这 两 个 ID 的 和 ， 假 设 丢失 的 两 个 ID 分 别 是 x 和 y， 我 们 只 能 知道 x 十 y 
的 值 ， 写 成 x 十 y 二 a， 并 不 能 分 辨 x- 和 vy 的 值 。 显 然 我 们 需要 更 多 的 信息 来 确 
定 x 和 y 的 值 。 让 我 们 回忆 一 下 初中 数学 的 二 元 方程 ， 两 个 变量 需要 两 个 方 
程 才能 求 出 解 ， 我 们 现在 只 有 一 个 ， 如 果 我 们 还 能 再 构造 出 一 个 关于 x 和 y 
的 方程 ， 就 能 求 出 x 和 y 的 值 。 可 能 读 到 这 里 ， 聪 明 的 读者 已 经 能 构造 出 第 
二 个 方程 了 。 

第 二 个 方程 有 很 多 种 构造 方法 ， 我 们 这 里 提供 一 种 供 大 家 参考 : 我 们 
再 用 一 个 所 有 ID 乘积 的 不 变量 ， 预 先 计 算 并 保存 好 所 有 ID 的 乘积 (“不 变 
量 *) ， 顺 序列 举 当 前 所 有 剩 下 的 ID ， 把 他 们 乘 起 来 得 到 乘积 ， 然 后 用 所 有 
ID 的 的 乘积 (“不 变量 *) 除 以 当前 剩 下 所 有 ID 的 乘积 ， 结 果 就 是 两 台 死 机 
的 机 器 ID 的 乘积 ， 也 就 是 xy 的 值 ， 写 成 xy=b。 这 样 我们 通过 联 立 上 面 两 个 
方程 x 十 y 二 a 和 xy 二 b， 就 可 以 计算 出 x 和 y 的 值 。 计 算 时 间 复 杂 度 为 O 
(N) ， 空 间 复杂 度 为 O (1) 。 

当然 这 里 其 实说 的 是 一 种 理想 的 情况 ， 聪 明 的 读者 可 能 会 发 现 这 里 有 
一 个 问题 。 因 为 ID 通常 是 一 个 比较 大 的 整数 ， 而 机 器 ID 的 数量 又 通常 比较 
多 ， 这 个 时 候 额 外 的 一 个 问题 就 是 很 多 整数 相 乘 结果 可 能 会 港 出 。 这 个 问 
题 涉 及 实现 的 问题 ， 我 们 就 不 多 加 讨论 了 ， 其 实 也 是 有 办 法 可 以 避免 的 ， 
比如 不 采用 乘积 的 形式 构造 第 二 个 方程 ， 而 采用 平方 和 的 形式 构造 第 二 个 
方程 。 


扩展 问题 


如 果 所 有 的 机 器 都 有 3 个 备份 ， 也 就 是 说 同一 ID 的 机 器 有 3 人 台 ， 而 且 同 
时 又 有 3 人 台 机 器 死机 ， 还 能 用 上 面 的 解法 4 思路 解决 么 ”如 果 有 N 个 备份 ， 而 
且 同 时 又 有 N 人 台 机 器 死机 ， 是 否 还 能 解决 ? 


相关 问题 


这 个 问题 本 质 上 也 是 从 一 堆 数 字 中 找到 丢失 的 一 个 数字 的 问题 。 有 这 
样 的 一 个 扑克 牌 抽 牌 问题 :“ 给 你 一 副 杂 乱 的 扑克 牌 (不 包括 大 小 王 ) ， 任 
意 从 其 中 抽出 一 张 牌 ， 怎 样 用 最 简单 的 方法 来 知道 抽出 的 是 113 中 的 哪 一 
张 (不 要 求知 道 花 色 ) ”。 


1.6 ”饮料 供 货 


在 微软 亚洲 研究 院 上 班 ， 大 家 早上 来 的 第 一 件 事 是 干 喻 呢 ? 查 看 邮 
件 ? No， 是 去 水 房 拿 饮料 : 酸奶， 豆浆， 绿茶、 王老吉、 咖啡 、 可 口 可 
和 (当然 ， 还 是 有 很 多 同事 把 拿 饮 料 当 做 第 二 件 事 ) 。 

管理 水 房 的 阿姨 们 每 天 都 会 准备 很 多 的 饮料 给 大 家 ， 为 了 提高 服务 质 
量 ， 她 们 会 统计 大 家 对 每 种 饮料 的 满意 度 。 一 段 时 间 后 ， 阿 姨 们 已 经 有 了 
大 批 的 数据 。 某 天 早上 ， 当 实习 生 小 飞 第 一 个 冲 进 水 房 并 一 次 拿 了 五 瓶 酸 
奶 、 四 瓶 王老吉 、 三 瓶 鲜 检 多 时 ， 阿 姨 们 隶 住 了 他 ， 要 他 帮忙 。 

从 阿姨 们 统计 的 数据 中 ， 小 飞 可 以 知道 大 家 对 每 一 种 饮料 的 满意 度 。 
阿姨 们 还 告诉 小 《，STC (Smart Tea Corp.) 负责 给 研究 院 供应 饮料 ， 每 天 
总 量 为 V。STC 很 神奇 ， 他 们 提供 的 每 种 饮料 之 单个 容量 都 是 2 的 方 寡 ， 比 
如 王老吉 ， 都 是 23 三 8 升 的 ， 可 乐 都 是 2? 三 32 升 的 。 当 然 STC 的 存货 也 是 有 
限 的 ， 这 会 是 每 种 饮料 购买 量 的 上 限 。 统 计数 据 中 用 饮料 名 字 、 容 量 、 净 
量 、 满 意 度 描述 每 一 种 饮料 。 

那么 ， 小 飞 如 何 完成 这 个 任务 ， 求 出 保证 最 大 满意 度 的 购买 量 呢 ? 
分 析 与 解法 
【解法 一 】 

我 们 先 把 这 个 问题 “数学 化 ”一 下 吧 。 

假设 STC 共 提供 n 种 饮料 ， 用 (S; 、V;、C;、H; 、B; ) (对 应 的 是 饮 
料 名 字 、 容 量 、 可 能 的 最 大 数量 、 满 意 度 、 实 际 购买 量 ) 来 表示 第 i 种 饮料 
(i 二 0，1，...，n 一 1) ， 其 中 可 能 的 最 大 数量 指 如 果 仅 买 某 种 饮料 的 最 大 
可 能 数量 ， 比 如 对 于 第 i 中 饮料 C; ==V/V; 。 

基于 如 上 公式 : ， 


饮料 总 容量 为 >》(Vi * Bi) ; 
i=0 


那么 题目 的 要 求 就 是 ， 在 满足 条 件 》(W * 80)= 产 的 基础 上 ， 求 解 


max [2 0 * Bi)} o 


对 于 求 最 优化 的 问题 ， 我 们 来 看 看 动态 规划 能 否 解决 。 用 Opt (V'， 
i) 表示 从 第 i，i 十 1，i 十 2，...，n 一 1，n 种 饮料 中 ， 算 出 总 量 为 V' 的 方案 
中 满意 度 之 和 的 最 大 值 。 

因此 ，Opt (V，n) 就 是 我 们 要 求 的 值 。 

那么 ， 我 们 可 以 列 出 如 下 的 推导 公式 : Opt (V '，, i) = 二 max{k*H, 十 
Opt (VY  —V ky i =D) } (k=0, 01) 

即 : 最 优化 的 结果 三 选择 第 k 种 饮料 x 满意 度 十 减 去 第 k 种 饮料 x 容量 的 
最 优化 结果 根据 这 样 的 推导 公式 ， 我 们 列 出 如 下 的 初始 边界 条 件 : 

Opt (0，n) 二 0， 即 容量 为 0 的 情况 下 ， 最 优化 结果 为 0。 

Opt (x,，n) 二 -INF (x! 二 0) ” (-INF 为 负 无 穷 大 ) ， 即 在 容量 不 为 0 
的 情况 下 ， 把 最 优化 结果 设 为 负 无 穷 大 ， 并 把 它 作 为 初 值 。 

那么 ， 根 据 以 上 的 推导 公式 ， 就 不 难 列 出 动态 规划 求解 代码 ， 如 下 所 
示 : 


代码 清单 1-9 


在 上 面 的 算法 中 ， 空 间 复杂 度 为 O0 (V*N) ， 时 间 复 杂 度 约 为 O 
(V*N*Max (C;) ) 。 

因为 我 们 只 需要 得 到 最 大 的 满意 度 ， 则 计算 opt[i][j] 的 时 候 不 需要 opt[j] 
[十 2]， 只 需要 opt[irj] 和 opt[i[j 十， 所 以 空间 复杂 度 可 以 降 为 O (v) 。 
【解法 二 】 


应 用 上 面 的 动态 规划 法 可 以 得 到 结果 ， 那 么 是 否 有 可 能 进一步 地 提高 
效率 呢 ? 我们 知道 动态 规划 算法 的 一 个 变形 是 备 扎 录 法 ， 备 扎 录 法 也 是 用 
一 个 表格 来 保存 已 解决 的 子 问题 的 答案 ， 并 通过 记忆 化 搜索 来 避免 计算 一 
些 不 可 能 到 达 的 状态 。 具 体 的 实现 方法 是 为 每 个 子 问 题 建立 一 个 记录 项 。 
初始 化 时 ， 该 纪录 项 存 入 一 个 特殊 的 值 ， 表 示 该 子 问题 尚未 求解 。 在 求解 
的 过 程 中 ， 对 每 个 待 求解 的 子 问 题 ， 首 先 查 看 其 相应 的 纪录 项 。 若 记录 项 
中 存储 的 是 初始 化 时 存 入 的 特殊 值 ， 则 表示 该 子 问题 是 第 一 次 遇 到 ， 此 时 


计算 出 该 子 问题 的 解 ， 并 保存 在 其 相应 的 记录 项 中 。 若 记录 项 中 存储 的 已 
不 是 初始 化 时 存 入 的 初始 值 ， 则 表示 该 子 问题 已 经 被 计算 过 ， 其 相应 的 记 
录 项 中 存储 的 是 该 子 问题 的 解答 。 此 时 只 需要 从 记录 项 中 取出 该 子 问题 的 
解答 即 可 。 

因此 ， 我 们 可 以 应 用 备忘录 法 来 进一步 提高 算法 的 效率 。 
代码 清单 1-10 


nt[V + 1]{(T + 1] opt;? // 子 问 题 的 记录 项 表 ， 假 设 从 主 到 ?种 饮料 中 ， 
1/ 找 出 容量 总 和 为 V” 的 一 个 方案 ， 快 乐 指数 最 多 能 够 达到 
1 opt 〈V'!I，i，T-1) ， 存 储 于 opt [Vv' ] [i]， 
初始 化 时 cpt 中 存储 值 为 -1， 表 示 该 子 问 题 尚 未 求解 


(type == 
(V == 0) 
return 
turn ~INF 
FV E00) 
return -INF 
else LE (V )) 
else if (opt 


] 
return opt[V] [typel]; // 该 子 问题 已 求解 ， 则 直接 返回 子 问题 的 解 ; 
了 问题 尚未 求解 ， 则 求解 该 子 问 题 


【解法 三 】 
请 注意 这 个 题目 的 限制 条 件 ， 看 看 它 能 否 给 我 们 一 些 特殊 的 提示 。 
我 们 把 信息 重新 整理 一 下 ， 按 饮料 的 容量 (单位 为 L) 排序 : 


Volume TotalCount Happiness 


20L TCo 0 Ho 0 
20L TCo 1 Ho 1 
Pad TCo. Ho no 
21L TC1! 0 H 10 
2 ICM_ 0 HM 0 


如 上 表 ， 我 们 有 no 种 容量 为 2° LL 的 饮料 ， 它 们 的 数量 和 快乐 指数 分 别 为 
(TC 0 Hy 0 《ITC 1 Hy 1 假设 最 大 容量 为 2M L。 一 开 
始 ， 如 果 V% (21 ) 非 零 ， 那 么 ， 我 们 肯定 需要 购买 20 工 容量 的 饮料 ， 至 少 

一 瓶 。 在 这 里 可 以 使 用 贪心 规则 ， 购 买 快乐 指数 最 高 的 一 瓶 。 除 去 这 个 ， 
我 们 只 要 再 购买 总 量 (V 一 20 ) 工 的 饮料 就 可 以 了 。 这 时 ， 如 果 我 们 要 购买 
21 工 容量 的 饮料 怎么 办 呢 ? 除了 21I 容 量 里 面 快 乐 指数 最 高 的 ， 我 们 还 应 该 
考虑 ， 两 个 容量 为 20 世 的 饮料 组 合 的 情况 。 其 实 我 们 可 以 把 剩 下 的 容量 为 20 
EL 的 饮料 之 快乐 指数 从 大 到 小 排列 ， 并 用 最 大 的 两 个 快乐 指数 组 合 出 一 个 新 
的 “容量 为 2L”2 的 饮料 。 不 断 地 这 样 使 用 贪心 原则 ， 即 得 解 。 这 是 不 是 就 简 
单 了 很 多 呢 ? 


1.7 ”光影 切割 问题 


不 少 人 很 爱 玩 游戏 ， 例 如 CSs。 游 戏 设计 也 成 为 程序 开发 的 热点 之 一 ， 
我 们 假设 要 设计 破旧 仓库 之 类 的 场景 作为 战争 游戏 的 背景 。 仓 库 的 地 面 会 
因为 阳光 从 屋顶 的 漏洞 或 者 窗口 照射 进来 而 形成 许多 光照 区 域 和 阴影 区 
域 。 为 了 简单 起 见 ， 假 设 不 同 区 域 的 边界 都 是 直线 2 ， 我 们 把 这 些 直 线 都 叫 
做 “光影 线 "， 并 且 不 存在 三 条 光影 线 相交 于 一 点 的 情况 。 如 图 1-8 所 示 : 


仓库 墙壁 


仓库 墙壁 x 


图 1-8 ”仓库 地 面 被 光影 分 割 成 不 同 的 区 域 


那么 ， 如 果 我 们 需要 快速 计算 某 个 时 刻 ， 在 X 坐 标 [A，B] 区 间 的 地 板 上 
被 光影 划分 成 多 少 块 。 如 何 才能 写 出 算法 来 计算 呢 ? 
分 析 与 解法 
【解法 一 】 
在 分 析 问 题 之 前 ， 我 们 可 以 先 研究 一 下 图 形 中 不 同 线段 之 间 的 天 系 。 
在 图 1-9 中 ， 每 一 条 直线 代表 一 条 光影 。 那 么 ， 直 线 相交 之 后 产生 的 分 
块 信息 是 否 和 直线 的 交点 有 直接 的 关系 呢 ? 


a a 
¥ 墙 墙 


图 1-9 ”投影 示意 图 


在 讨论 这 种 类 型 问题 的 时 候 ， 可 以 先 通过 分 析 比 较 简 单 的 例子 来 得 到 
一 些 规律 。 
对 于 两 条 直线 的 情况 ， 如 图 1-10 所 示 : 


图 1-10 ”直线 分 割 示意 图 


显然 ， 两 条 直线 最 多 能 把 区 间 分 划 为 4 个 部 分 。 
对 于 三 条 直线 ， 会 有 如 下 的 情况 ， 如 图 1-11 所 示 : 


图 1-11 直线 分 割 示意 图 


条 直线 如 果 只 有 一 个 交点 ， 会 把 空间 分 成 6 个 部 分 〈 左 图 ) ; 如 果 有 

两 个 交点 ， 会 把 空间 分 化 为 7 个 部 分 ( 右 图 ) 。 

那么 ， 如 下 规律 可 循 : 

两 条 直线 -一 个 交点 一 空间 分 成 4 个 部 分 

三 条 直线 -两 个 交点 -空间 分 成 6 个 部 分 

三 条 直线 -三 个 交点 一 空间 分 成 7 个 部 分 

由 上 可 以 推出 ， 每 增加 一 条 直线 ， 如 果 增 加 m 个 交点 ， 那 么 这 条 直线 被 
新 增加 的 m 个 交点 ， 分 成 (m 十 1) 段 。 每 一 段 直 线 会 将 原来 一 块 区 域 分 成 
两 块 ， 因 此 ， 新 增加 (m 十 1) 块 新 区 域 。 如 果 总 共有 N 条 直线 ，M 个 交 
点 ， 那 么 区 域 的 数目 为 N 十 M 十 1。 

因此 , 平面 被 划分 成 多 少 块 的 间 题 可 以 转化 为 直线 的 交点 有 多 少 个 的 
问题 。 

那么 ， 将 N 条 直线 逐一 投影 到 坐标 区 间 上 ， 假 设 当 第 k 条 直线 投影 到 坐 
标 区 间 的 时 候 ， 它 与 之 前 的 k 一 1 条 直线 的 交点 为 N, 个 ， 那 么 它 使 得 区 间 
[A，B] 之 间 的 平面 块 增加 Ni 十 1 个 (为 什么 ) ， 全 部 直线 (N 条 ) 都 投影 完 
毕 之 后 ， 我 们 可 得 到 区 间 [A，B] 平 面 被 划分 的 块 数 ， 即 
+ > (Nk +1)=1+N + > (Ne) =1+AN+| 交 点 | ， 其 中 1 为 区 间 [A，B] 的 初始 平 


面 块 数 。 
因此 ， 只 要 求 出 所 有 直线 两 两 相交 的 交点 ， 然 后 再 查找 哪些 交点 在 
[A，B] 之 间 ， 进 而 就 可 以 求 出 平面 被 划分 的 块 数 。 我 们 可 以 考虑 将 N 条 直线 


的 所 有 交点 存储 于 数组 Intersect 中 ， 然 后 进行 计算 。 这 样 ， 算 法 的 复杂 度 就 
转化 成 查找 交点 数组 的 问题 了 。 
首先 ， 需 要 对 数组 进行 初始 化 。 初 始 化 的 过 程 ， 实 质 上 就 是 计算 所 有 
交点 的 过 程 。 我 们 需要 查询 每 条 直线 是 否 与 其 他 N 一 1 条 直线 有 交点 ， 初 始 
化 的 时 间 复 杂 度 将 为 O(N? ) 。 每 次 查询 的 时 间 复 杂 度 为 O (|Intersect|) 。 
如 果 在 初始 化 后 对 所 有 交点 按 X 轴 坐标 排序 ， 则 复杂 度 为 O(N? 
十 |Intersectj*log|Intersect|) ， 其 中 |Intersect|*log|Intersect| 为 排序 时 间 ， 之 后 
可 采用 二 分 查找 ， 每 次 查询 的 时 间 复 杂 度 将 为 O(log|Intersect|) 。 


【解法 二 】 
但 是 ， 如 果 查 询 比 较 少 的 话 ， 我 们 是 否 可 以 不 浪费 那么 多 时 间 来 预 处 
理 呢 ? 


a b a c 
b b 
b a 
C a 


图 1-12 ”直线 分 割 示意 图 


分 析 上 面 两 个 情况 (如 图 1-12 所 示 ) ， 左 图 为 有 一 个 交点 的 情况 ， 两 条 
直线 a 和 1b 与 左边 界 的 交点 从 上 到 下 按 顺序 为 (a，b) ， 右 边界 上 的 交点 顺 
序 为 (b，a) ， 可 以 看 到 ， 顺 序 被 反 过 来 了 ， 因 为 它们 在 两 个 边界 之 间 有 
一 个 交点 。 如 果 没 有 交点 ， 它 们 与 边界 的 交点 顺序 则 不 会 有 变化 。 

进一步 分 析 图 1-12 的 右 图 可 以 知道 ， 区 域内 的 交点 数目 就 等 于 一 个 边界 
上 交点 顺序 相对 另 一 个 边界 交点 顺序 的 逆序 总 数 (这 里 利用 到 条 件 “ 没 有 三 
条 直线 相交 于 一 个 点 ") 。 在 右 图 中 ， 左 边界 顺序 为 (a，b，c) ， 右 边界 为 
(Gs 假设 TDE25 Ce 那么 后 届 23227 9 它 的 
逆序 数 为 3。 

因此 ， 问 题 转 化 为 求 一 个 N 个 元 素 的 数组 的 逆序 数 〈 第 三 次 对 问题 进行 
了 转换 @) 。 


最 直接 的 求解 逆序 数 方法 还 是 O(N? ) ， 如 果 用 分 治 的 策略 可 以 将 时 
间 复 杂 度 降 为 O(N*log, N) ， 求 N 个 元 素 的 逆序 数 的 分 治 思想 如 下 ， 首 先 
求 前 N/2 个 元 素 的 逆序 数 ， 再 求 后 N/2 个 元 素 的 逆序 数 ， 最 后 在 排序 过 程 中 
合并 前 后 两 部 分 之 间 的 逆序 数 。 
小 结 

从 上 面 的 分 析 中 可 以 看 出 ， 在 把 一 个 相当 复杂 的 解答 转换 成 一 个 相对 
容易 的 解答 的 过 程 中 ， 经 历 了 三 次 的 问题 转换 和 转化 。 同 样 地 ， 在 实际 问 
题 的 分 析 中 ， 我 们 也 需要 尽 可 能 地 考虑 ， 问 题 是 否 就 这 么 复杂 ， 是 否 可 以 
进行 进一步 的 转化 呢 ? 是 否 有 更 简单 或 优雅 的 办 法 来 实现 呢 ? 


1.8 小 飞 的 电梯 调度 算法 


微软 亚洲 研究 院 所 在 的 希 格 玛 大 厦 一 共有 6 部 电梯 。 在 高 峰 时 间 ， 每 层 
都 有 人 人 上下， 电梯 在 每 层 都 停 。 实 习 生 小 飞 常常 会 被 每 层 都 停 的 电梯 弄 得 
很 不 耐烦 ， 于 是 他 提出 了 这 样 一 个 办 法 : 

由 于 楼 层 并 不 太 高 ， 那 么 在 繁忙 的 上 下 班 时 间 ， 每 次 电梯 从 一 层 往 上 
走时 ， 我 们 只 允许 电梯 停 在 其 中 的 某 一 层 。 所 有 的 乘客 都 从 一 楼 上 电梯 ， 
到 达 某 层 楼 后 ， 电 梯 停 下 来 ， 所 有 乘客 再 从 这 里 爬 楼 梯 到 自己 的 目的 层 。 
在 一 楼 的 时 候 ， 每 个 乘客 选择 自己 的 目的 层 ， 电 梯 则 自动 计算 出 应 停 的 楼 
层 

问 : 电梯 停 在 哪 一 层 楼 ， 能 够 保证 这 次 乘坐 电梯 的 所 有 乘客 爬 楼 梯 的 
层 数 之 和 最 少 。 

分 析 与 解法 

该 问题 本 质 上 是 一 个 优化 问题 。 在 分 析 问 题 之 前 ， 首 先 得 为 这 个 问题 
找到 一 个 合适 的 抽象 模型 。 从 问题 中 可 以 看 出 ， 有 两 个 因素 会 影响 到 最 后 
的 结果 : 乘客 的 数目 以 及 需要 停 的 目的 楼 层 。 因 此 ， 我 们 可 以 从 统计 到 达 
各 层 的 乘客 数目 开始 分 析 。 

假设 楼 层 总 共有 N 层 ， 电 梯 停 在 第 x 层 ， 要 去 第 i 层 的 乘客 数目 总 数 为 
Tot[i ， 这 样 ， 所 把 楼 梯 的 总 数 就 是 sigma{Tot[i]*|i 一 x|}。 

因此 ， 我 们 就 是 要 找到 一 个 整数 x， 使 得 sigma{Tot[i]*|i 一 x|} 的 值 最 小 。 

[解法 一 】 

对 于 这 个 问题 ， 在 深入 考虑 之 前 ， 可 以 看 看 是 否 有 简单 的 办 法 。 

可 以 考虑 从 第 1 层 开 始 枚 举 x 一 直到 第 N 层 ， 然 后 再 计算 出 如 果 电 梯 在 第 
x 层 楼 停 的 话 ， 所 有 乘客 总 共 要 爬 多 少 层 楼 。 这 是 最 为 直接 的 一 个 解法 。 

可 以 看 出 ， 这 个 算法 需要 两 重 循环 来 完成 计算 。 
代码 清单 1-11 


这 个 基本 解法 的 时 间 复 杂 度 为 O (N2 ) 。 
【解法 二 】 

我 们 希望 尽 可 能 地 减少 算法 的 时 间 复 杂 度 。 那 么 ， 是 否 有 可 能 在 低 于 O 
(N? ) 的 规模 下 求 出 这 个 问题 的 解 呢 ? 

我 们 可 以 进一步 地 进行 分 析 。 

假设 电梯 停 在 第 i 层 楼 ， 显 然 我们 可 以 计算 出 所 有 乘客 总 共 要 把 楼 梯 的 
层 数 Y。 如 果 有 Ni 个 乘客 目的 楼 层 在 第 i 层 楼 以 下 ， 有 N, 个 乘客 在 第 i 层 
楼 ， 还 有 N; 个 乘客 在 第 i 层 楼 以 上 。 这 个 时 候 ， 如 果 电 梯 改 停 在 i 一 1 层 ， 所 
有 目的 地 在 第 ji 层 及 以 上 的 乘客 都 需要 多 爬 1 层 ， 总 共 需 要 多 爬 N, 十 Ns 层 ， 
而 所 有 目的 地 在 第 i 一 1 层 及 以 下 的 乘客 可 以 少 爬 1 层 ， 总 共 可 以 少 爬 Ni 层 。 
因此 ， 乘 客 总 共 需 要 把 的 层 数 为 Y 一 Nj 十 (N, 十 N3) =Y 一 (Ni 一 N, 一 Na 
) 层 。 

反之 ， 如 果 电 梯 在 i 十 1 层 停 ， 那 么 乘客 总 共 需 要 把 的 层 数 为 Y 十 (Ni 十 
N, 一 Ns ) 层 。 由 此 可 见 ， 当 Ni >N, 十 Na 时 ， 电 梯 在 第 i 一 1 层 楼 停 更 好 ， 
乘客 走 的 楼 层 数 减少 (N| 一 N, 一 N3 ) ; 而 当 Ni 十 N, <N; 时 ， 电 梯 在 i 十 1 
层 停 更 好 ;其 他 情况 下 ， 电 梯 停 在 第 i 层 最 好 。 

根据 这 个 规律 ， 我 们 从 第 一 层 开始 考察 ， 计 算 各 位 乘客 需要 扑 楼 梯 的 
数目 。 然 后 再 根据 上 面 的 策略 进行 调整 ， 直 到 找到 最 佳 楼 层 。 总 的 时 间 复 
杂 度 将 降 为 O(N) ， 代 码 如 下 : 
代码 清单 1-12 


n(nTargetFloor, nMinFloor); 


扩展 问题 


1. 往 上 扑 楼 梯 ， 总 是 比 往 下 走 要 累 的 。 假 设 往 上 把 一 个 楼 层 ， 要 耗费 
k 单 位 的 能 量 ， 而 往 下 走 只 需要 耗费 1 单位 的 能 量 ， 那 么 如 果 题 目 条 件 改 为 
让 所 有 人 消耗 的 能 量 最 少 ， 这 个 问题 怎么 解决 呢 ? 

这 个 问题 可 以 用 类 似 上 面 的 分 析 方 法 来 解答 ， 因 此 笔者 不 再 累 述 ， 留 
给 读者 自行 解决 。 

2. 在 一 个 高 楼 里 面 ， 电 梯 只 在 某 一 个 楼 层 停 ， 这 个 政策 还 是 不 太 人 性 
化 。 如 果 电 梯 会 在 k 个 楼 层 停 呢 ? 读者 可 以 发 挥 自己 的 想象 力 ， 看 看 如 何 寻 
找 最 优 方案 。 


1.9 ”高 效率 地 安排 见面 会 


在 校园 招聘 的 季节 里 ， 为 了 能 让 学 生 们 更 好 地 了 解 微软 亚洲 研究 院 各 
研究 组 的 情况 ，HR 部 门 计划 为 每 一 个 研究 组 举办 一 次 见面 会 ， 让 各 个 研究 
组 的 员工 能 跟 学 生 相 互 了 解 和 交流 。 已 知 有 n 位 学 生 ， 他 们 分 别 对 m 个 研究 
组 中 的 若干 个 感 兴 趣 。 为 了 满足 所 有 学 生 的 要 求 ，HR 希 望 每 个 学 生 都 能 参 
加 自己 感 兴趣 的 所 有 见面 会 。 如 果 每 个 见面 会 的 时 间 为 t， 那 么 ， 如 何 安排 
才能 够 使 得 所 有 见面 会 的 总 时 间 最 短 ? 

最 简单 的 办 法 ， 就 是 把 m 个 研究 组 的 见面 会 时 间 依 次 排 开 ， 那 我 们 就 要 
用 m*t 的 总 时 间 ， 我 们 有 10 多 个 研究 小 组 ， 时 间 会 拖 得 很 长 ， 能 否 进一步 提 
高 效率 ? 

分 析 与 解法 

解决 这 种 问题 ， 建 立 合适 的 模型 是 第 一 步 。 在 本 题 中 ， 如 果 两 个 小 组 
中 有 任意 一 位 同学 对 他 们 都 感 兴 趣 ， 我 们 则 不 能 把 这 两 个 小 组 的 见面 会 安 
排 在 同一 个 时 间 内 。 如 果 没 有 同学 同时 对 这 两 个 研究 小 组 感 兴趣 的 话 ， 它 
们 之 间 就 没有 约束 。 很 自然 地 ， 我 们 可 以 想到 利用 图 模型 来 解决 这 个 问 
题 。 

我 们 把 每 个 小 组 看 成 是 一 些 散 布 的 点 。 如 果 有 一 位 同学 同时 对 两 个 小 
组 感 兴趣 ， 就 在 这 两 个 小 组 对 应 的 两 个 点 间 加 上 一 条 边 。 所 以 ， 如 果 某 个 
同学 同时 对 k 个 小 组 感 兴趣 ， 那 么 这 k 个 小 组 中 任意 两 个 小 组 对 应 的 顶点 之 
间 都 要 有 一 条 边 。 例 如 ， 有 两 位 同学 A 和 B， 他 们 分 别 希望 参加 (1，2， 

3) 和 (1，3，4) 小 组 的 见面 会 。 那 么 ， 根 据 上 面 的 构图 方法 ， 我 们 可 以 
得 到 下 面 的 图 1-13: 


图 1-13 ”参加 见面 会 选择 示意 图 


见面 会 最 少 的 时 间 安 排 就 对 应 于 这 个 图 的 最 少 着 色 问 题 。 图 的 最 少 着 
色 问 题 可 以 这 样 描述 ， 对 于 一 个 图 G (E，V) ， 试 用 最 少 的 颜色 为 这 个 图 


的 顶点 着 色 ， 使 得 Y(7 ,7 ) & £ ， 有 v; 和 vj 颜色 不 同 。 图 的 最 少 着 色 问题 
至 今 没有 有 效 的 算法 ， 但 可 以 用 下 面 两 个 思路 求解 。 
【解法 一 】 

对 顶点 1 分 配 颜色 1， 然 后 对 剩 下 的 n 一 1 个 顶点 枚 举 其 所 有 的 颜色 可 


能 ， 再 一 一 验证 是 否 可 以 满足 我 们 的 着 色 要 求 ， 枚 举 的 复杂 度 是 
(A((w 一 1)”) ， 验 证 一 种 颜色 配置 是 否 满 足 要 求 需要 的 时 间 复 杂 度 是 Coz) 
。 所 以 总 共 的 时 间 复 杂 度 是 CX(w-1)”xr)。 时 间 复 杂 度 高 ， 但 是 能 够 保证 得 
到 正确 的 结果 。 算 法 的 性 能 还 在 于 使 用 有 用 的 上 下 界 函 数 剪 枝 来 避免 不 必 
要 搜索 。 
【解法 二 】 

我 们 可 以 党 试 对 这 个 图 进行 K 种 着 色 ， 首 先 把 K 设 为 1， 看 看 有 没有 合 
适 的 方案 ， 再 逐渐 把 K 提 高 。 当 假设 待 求解 的 图 之 最 少 着 色 数 远 小 于 图 的 顶 
点 数 时 ， 则 这 个 方法 的 复杂 度 要 远 低 于 解法 一 。 

当然 ， 我 们 还 可 以 用 启发 式 算 法 来 得 到 一 个 近似 解 ， 而 不 是 最 优 解 。 
扩展 问题 
【问题 一 】 

见面 会 之 后 ， 正 式 的 面试 就 陆续 开始 进行 了 。 某 一 天 ， 在 微软 亚洲 研 
究 院 有 N 个 面试 要 进行 ， 它 们 的 时 间 分 别 为 [B[i，E[] (B 引 为 面试 开始 时 


间 ，E 和 为 面议 结束 时 间 ) 。 假 设 一 个 面试 者 一 天 只 参加 一 个 面试 。 为 了 给 
面试 者 提供 一 个 安静 的 便于 面试 者 发 挥 的 环境 ， 我 们 希望 将 这 N 个 面试 安排 
在 若干 个 面试 点 。 不 同 的 面试 在 同一 个 时 间 不 能 被 安排 在 同一 个 面试 点 。 
如 果 你 是 微软 亚洲 研究 院 的 HR， 现 在 给 定 这 N 个 面试 的 时 间 之 后 ， 你 能 计 
算出 至 少 需要 多 少 个 面试 点 吗 ? 请 给 出 一 个 可 行 的 方案 。 比 如 图 1-14 有 4 个 
面试 ， 分 别 在 时 间 段 [L，5]，[2，3]，[3，4]，[3，6] 进 行 。 


A [1,5] 
B [2,3] 3 

C [3,4] 一 一 一 
D [3,6] 


图 1-14 面试 时 间 示意 图 


刚 看 完 上 面 的 建立 图 模型 思路 的 读者 可 能 会 说 ， 这 道 题 也 可 以 用 图 模 
型 求解 啊 。 每 场面 试 是 一 个 顶点 ， 如 果 两 场面 试 时 间 上 有 重 亚 ， 就 用 一 条 
边 把 它们 连接 起 来 。 这 样 ， 这 个 问题 不 也 转化 成 一 个 图 的 最 少 着 色 问 题 了 
吗 ? 不 错 ， 还 是 同样 的 模型 。 对 于 这 个 新 的 问题 ， 能 否 在 多 项 式 时 间 复 杂 


度 内 求 出 解 呢 ? 
不 过 这 个 问题 和 原 问题 有 一 点 点 不 同 ， 因 为 每 个 面试 对 应 于 一 个 时 间 


区 间 。 由 这 些 时 间 区 间 之 间 的 约束 关系 转化 得 到 的 图 ， 属 于 区 间 图 。 我 们 
可 以 通过 贪心 策略 来 解决 。 算 法 的 思路 就 是 对 于 所 有 的 面试 I[i] 二 [BI[i]， 
E[i]， 按 B 自 从 小 到 大 排序 ， 然 后 按 顺 序 对 各 个 区 间 着 色 。 对 当前 区 间 |i 着 色 
时 ， 必 须 保证 所 着 的 颜色 (Color[i]) 没有 被 出 现在 这 个 区 域 之 前 且 时 间 段 
与 当前 区 间 有 重 灵 的 区 间 用 到 。 假 设 面试 的 总 数 为 N， 那 么 相应 的 代码 如 
下 : 

代码 清单 1-13 


nMaxColors 就 是 最 后 返回 的 所 需 的 最 少 颜 色 。isForbidden 是 对 于 每 个 时 
间 区 间 i， 其 他 时 间 区 间 j 中 开始 时 间 位 于 这 个 时 间 区 间 之 前 的 且 与 这 个 时 间 
区 间 有 重 玛 的 面试 所 占用 的 颜色 的 标识 数组 。Overlap 函 数 ， 则 是 用 来 判断 
两 个 时 间 区 间 是 否 有 重 芍 。 

通过 简单 分 析 ， 我 们 可 以 知道 这 个 算法 的 时 间 复 杂 度 是 O(N*) 。 实 
际 上 ， 这 个 区 间 图 中 每 一 个 顶点 所 代表 的 时 间 区 间 ， 是 在 一 个 一 维 的 时 间 
轴 上 顺序 排列 的 。 我 们 只 需要 找到 这 个 时 间 轴 上 的 某 一 个 时 间 点 ， 使 包括 
这 个 时 间 点 的 时 间 区 间 个 数 最 多 〈 设 为 MaxI) ， 那 么 这 个 MaxI 就 是 我 们 要 
求 的 值 。 读 者 可 以 自行 证 明 ， 上 面 的 多 项 式 复杂 度 算法 可 以 找到 这 个 
MaxI。 而 一 个 普通 的 图 ， 没 有 这 种 在 某 个 一 维 轴 上 顺序 排列 的 性 质 ， 所 以 
没 办 法 用 这 种 贪心 算法 得 到 最 优 方案 。 

此 外 ， 相 信 有 些 读者 已 经 发 现 ， 在 上 述 算法 中 ， 查 找 一 个 可 行 颜色 的 
时 候 ， 我 们 遍历 了 整个 isForbidden 数 组 。 如 果 我 们 使 用 更 高 效 的 存储 数据 结 
构 (例如 ， 堆 ) ， 可 以 进一步 把 时 间 复 杂 度 降低 到 O (N*log, N) 。 

如 果 我 们 只 想得到 最 少 所 需 的 颜色 数 ， 则 把 所 有 的 B[i]、E[i] 按 大 小 排 
序 ， 得 到 一 个 长 度 为 2*N 的 有 序数 组 。 然 后 我 们 遍历 这 个 数组 ， 遇 到 一 个 
B[i， 就 把 当前 已 使 用 的 颜色 数目 加 1， 在 遇 到 对 应 的 E[i 时 ， 就 把 当前 已 经 
使 用 的 颜色 数目 减 1。 同 时 记录 每 次 循环 时 ， 最 多 有 多 少 种 颜色 正 被 使 用 
( 设 为 MaxColor) ， 循 环 结束 时 ，MaxColor 就 是 我 们 需要 的 最 少 颜色 数 。 
这 个 算法 的 时 间 复 杂 度 主要 是 由 排序 所 影响 ， 复 杂 度 应 为 O(N*log, N) 。 
这 个 算法 的 代码 如 下 : 
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/*TimePoints 数组 就 是 将 所 有 的 B[i] ,E[i] 按 大 小 排序 的 结果 。 


这 个 数 : 组 的 元 素 有 两 个 成 员 ， 一 个 是 val, 表示 这 个 元 素 代表 的 时 间 点 的 数值 ， 
男 一 个 是 type, 表示 这 个 元 素 代表 的 时 间 点 是 一 个 时 间 段 的 开始 (B[i】] ) ， 还 是 结束 (E [i]) 
int nColorUsing 0, MaxColor 0; 
for(int 4 = 0; 1 < * N: ++) 
{ 
if (TimePoints[i] ,type == “Begin”) 
1 
> MaxColor) 
3X lor = ylorUs ao; 
} 
else 
nColorUsing-- 
【问题 二 


小 飞 看 了 时 间 安 排 ， 他 发 现 自 Ve De 交 全 人 
被 安排 在 同一 天 的 第 一 个 和 最 后 一 个 ， 他 觉得 不 爽 ， 能 不 能 在 优化 总 的 见 
会 时 间 的 基础 上 ， 让 每 个 同学 参加 见面 会 的 时 间 尽 量 集中 ? 


1.10 ” 双 线 程 高 效 下 载 


我 们 经 常 需要 编写 程序 ， 从 网 络 上 下 载 数据 ， 然 后 存储 到 硬盘 上 。 一 
个 简单 的 做 法 ， 就 是 下 载 一 块 数据 ， 然 后 写 入 硬盘 ， 然 后 再 下 载 ， 再 写 入 
硬盘 ..….…... 不 断 重复 这 个 过 程 ， 直 到 所 有 的 内 容 下 载 完毕 为 止 。 能 否 对 此 进 
行 优化 ? 

我 们 不 妨 对 问题 做 一 些 抽象 和 简化 : 

1. 假设 所 有 数据 块 的 大 小 都 是 固定 的 。 你 可 以 使 用 一 个 全 局 缓存 区 : 
Block g_buffer[ BUFFER_ COUNTI] 

2. 假设 两 个 基本 函数 已 经 实现 〈 你 可 以 假定 两 个 图 数 都 能 正常 工作 ， 
不 会 抛 出 异常 ) : 


//downloads a block from Internet sequentially in each call 
// return true, if the entire file is downloaded, otherwise false. 


bool GetBlockFromNet (Block * out block); 


//writes a block to hard disk 


bool WriteBlockToDisk (Block * in block); 
在 这 个 基础 上 上， 上述 的 直观 想法 可 以 用 下 列 伪 代 码 实现 : 
代码 清单 1-15 


Crue) 


可 以 看 到 ， 在 上 述 方法 中 ， 我 们 要 下 载 完 一 块 数据 之 后 才能 写 入 硬 
盘 。 下 载 数据 和 写 入 硬盘 的 过 程 是 串 行 的 。 为 了 提高 效率 ， 我 们 希望 能 够 
设计 两 个 线程 ， 使 得 下 载 和 写 硬 盘 能 并 行进 行 : 

线程 A: 从 网 络 中 读 取 一 个 数据 块 ， 存 储 到 内 存 的 缓存 中 。 

线程 B: 从 缓存 中 读 取 内 容 ， 人 存储 到 文件 中 。 

试 实 现 如 下 子 程序 : 

1. 初始 化 部 分 

2. 线程 A 


3. 线程 B 
你 可 以 使 用 下 面 的 多 线程 API: 


代码 清单 1-16 
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如 果 网 络 延迟 为 L; ， 磁 盘 1/O 延 迟 为 L, ， 将 此 多 线程 与 单线 程 进行 比 
较 ， 分 析 这 个 设计 的 性 能 问题 ， 并 考虑 是 否 还 有 其 他 改进 的 设计 方法 ? 
分 析 与 解法 

这 道 题目 出 现在 2007 年 微软 校园 招聘 的 笔试 中 。 出 题 者 为 了 让 不 同 知 
识 背景 的 同学 都 能 发 挥 水 平 ， 特 地 提供 了 详细 的 说 明 。 这 样 ， 没 有 接触 过 
实际 的 Windows 多 线程 编程 的 同学 也 能 写 出 代码 。 现 在 越 来 越 多 的 电脑 采用 
双核 甚至 是 多 核 的 体系 结构 ， 并 行 计算 会 成 为 常用 的 程序 工作 模式 。 这 道 
题 只 是 一 个 简单 的 例子 。 


在 实际 工作 中 ， 程 序 员 经 常 要 依靠 已 有 的 模块 和 API 完 成 任务 ， 这 些 模 
块 也 许 只 有 简单 的 接口 说 明 ， 没 有 源 代 码 。 在 这 种 情况 下 能 够 高 效 地 完成 
任务 ， 也 是 优秀 程序 员 的 特质 之 一 。 

我 们 需要 使 用 两 个 线程 来 完成 从 网 络 上 下 载 数 据 并 存储 到 硬盘 上 的 过 
程 。 下 载 线程 和 存储 线程 共用 一 个 全 局 共享 缓存 区 ， 我 们 需要 协调 两 个 线 
程 的 工作 。 下 面 若干 因素 是 我 们 要 重点 考虑 的 : 

1. 什么 时 候 才 算 完成 任务 ? 

两 个 线程 必须 协同 工作 ， 将 网 络 上 的 数据 下 载 完毕 并 且 完 全 存储 到 硬 
盘 上 ， 只 有 在 这 个 时 候 ， 两 个 线程 才能 正常 终止 。 

2. 为 了 提高 效率 ， 和 希望 两 个 线程 能 尽 可 能 地 同时 工作 。 

如 果 使 用 Mutex， 下 载 和 存储 线程 将 不 能 同时 工作 。 因 此 ，Semaphore 
是 更 好 的 选择 2。 

3. 下 载 和 存储 线程 工作 的 必要 条 件 : 

如 果 共 享 缓存 区 已 满 ， 没 有 缓冲 空间 来 存储 下 载 的 内 容 ， 则 应 该 暂停 
下 载 。 如 果 所 有 的 内 容 都 已 经 下 载 完 毕 ， 也 没 必 要 继续 下 载 。 

如 果 缓 存 区 为 空 ， 则 没 必 要 运行 存储 线程 。 进 一 步 ， 如 果 下 载 工作 已 
经 完成 ， 存 储 线程 也 可 以 结束 了 。 

4. 共享 缓存 区 的 数据 结构 。 

下 载 线程 和 存储 线程 工作 的 过 程 是 “先进 先 出 *"， 先 下 载 的 内 容 要 先 存 
储 ， 这 样 才 能 保证 内 容 的 正确 顺序 。“ 先 进 先 出 ”的 典型 数据 结构 是 队列 。 
由 于 我 们 采用 了 固定 的 缓冲 空间 来 保存 下 载 的 内 容 ， 循 环 队列 会 是 一 个 很 
好 的 选择 。 

综合 考虑 上 面 的 因素 ， 调 用 题目 提供 的 API 可 以 得 到 下 面 这 个 可 供 参 考 
的 伪 代 码 : 
代码 清单 1-17 


UFFER COUNT); 


BUFFER COUNT); 


void ProcaA() 
| 
GetBlockFromNet (g buffer + in index); 
1 ) BUFFER COUNT; 
} 


g seFull .Unsignal (); 
t kToDisk(g buffer + out index); 


上 面 的 伪 代 码 中 ，ProcA 和 ProcB 的 操作 能 够 一 一 对 应 起 来 ， 看 起 来 很 
美 。 从 上 面 的 伪 代 码 可 以 看 出 ， 下 载 线程 和 存储 线程 可 以 同时 工作 。 如 果 
网 络 延 迟 为 L; ， 磁 盘 IO 延 迟 为 L， ， 那 么 这 个 多 线程 程序 执行 的 时 间 约 为 
Max (Li ，L, ) 。 尤 其 是 需要 下 载 的 内 容 很 多 的 时 候 ， 基 本 可 以 保证 两 个 
线程 是 流水 线 工 作 。 而 在 单线 程 的 情况 下 ， 需 要 的 时 间 是 Lj 十 L， 。 


如 果 网 络 延迟 远大 于 LO 存储 延迟 ， 则 多 个 下 载 线程 的 设计 将 可 以 进 一 
步 改 善 性 能 。 但 也 将 带 来 一 些 更 复杂 的 问题 。 多 个 下 载 线程 和 存储 线程 之 
间 如 何 协同 工作 呢 ? 这 个 问题 留 给 读者 思考 。 

微软 亚洲 研 院 的 研发 主管 邹 欣 曾经 参加 过 多 个 Microsoft Outlook 版 本 的 
开发 ， 他 提供 了 这 个 题目 ， 并 且 讲 了 下 面 的 故事 : 

在 Outlook 和 Exchange 服 务 器 连接 的 情况 下 ，Outlook 需 要 下 载 一 系列 的 
“离线 地 址 短文 件 ”(OAB，Offline Address Book) 以 支持 Outlook 在 离线 的 
情况 下 还 能 正常 地 搜索 到 公司 的 所 有 E-mail 用 户 和 用 户 组 的 信息 。 这 个 文件 
相当 大 ， 对 于 Microsoft 这 样 的 公司 来 说 ， 大 概 有 300MB 人 500MB ， 原 来 的 
算法 是 单线 程 的 (正如 题目 所 示 ) ， 运 行 要 花 很 长 时 间 ， 用 户 抱怨 他 们 不 
得 不 盯 着 这 个 对 话 框 的 进度 条 缓慢 移动 ， 非 常 不 来。 于 是 我 写 了 一 个 双 线 
程 的 方案 ， 在 经 过 反复 测试 ， 在 得 到 测试 人 员 的 认可 后 ， 我 把 修改 正式 提 
交 到 源 代 码 库 。 几 天 后 ， 同 事 们 高 兴 地 反映 ， 新 的 版 本 的 确 快 多 了 ! 但 是 
又 有 另 两 位 同事 抱 忽 ， 这 个 功能 太 “ 狠 ”了 ， 在 笔记 本 电脑 上 ，Outlook 像 疯 
了 一 样 地 写 硬 盘 ， 他 们 都 做 不 了 其 他 事情 ! 后 来 几经 讨论 和 试验 ， 我 们 做 
了 进一步 修改 ， 如 果 用 户 正 在 使 用 电脑 ， 那 么 双 线 程 会 自动 放 慢 速度 ， 如 
果 发 现 用 户 在 几 秒 钟 内 没有 鼠标 、 键 盘 的 输入 ， 那 双 线 程 会 逐渐 恢复 高 速 
运行 。 从 那 以 后 ， 我 就 再 也 没有 听 到 类 似 的 抱怨 了 。 也 许 提高 程序 效能 

(performance) 的 最 高 境界 ， 就 是 把 事情 做 了 ， 同 时 又 不 让 用 户 感觉 到 程 
序 在 费力 地 做 事情 。 

最 近 发 布 的 windows 桌 面 搜索 (Desktop Search) 也 有 类 似 的 < 人 性 化 ” 
功能 ， 如 果 你 正在 使 用 电脑 ， 那 么 它 会 提示 “Index speed is reduced while 
youre using the computer”。 那 么 windows 中 的 什么 API 能 了 解 用 户 是 否 在 使 
用 鼠标 或 者 键盘 呢 ? 这 个 问题 留 给 读者 去 探索 。 


1.11 NIM (1) 一 排 石 头 的 游戏 


面试 是 一 个 让 面试 双方 增进 互相 了 解 的 过 程 ， 不 一 定 总 是 你 问 我 丛 ， 
有 时 候 两 人 可 以 玩 一 些 游戏 ， 比 如 : 

N 块 石头 排 成 一 行 ， 每 块 石头 有 各 自 固定 的 位 置 。 两 个 玩家 依次 取石 
头 ， 每 个 玩家 每 次 可 以 取 其 中 任意 一 块 石 头 ， 或 者 相 邻 的 两 块 石 头 ， 石 头 
在 游戏 过 程 中 不 能 移 位 〈《 即 编号 不 会 改变 ) ， 最 后 能 将 剩 下 的 石头 一 次 取 
光 的 玩家 获胜 。 


这 个 游戏 有 必 胜 策略 吗 ? 
分 析 与 解法 


初 看 这 个 游戏 ， 感 觉 输 赢 似 乎 只 是 运气 的 问题 。 但 是 我 们 通过 深入 分 
析 ， 还 是 可 以 发 现 一 些 规 律 的 。 

注意 游戏 中 “相连 ”这 个 条 件 ， 若 给 N 块 石头 从 1 到 N 依 次 编号 ， 则 我 们 只 
能 取 编 号 相连 的 两 块 石头 ， 例 如 可 以 同时 取 编 号 为 1 和 2 的 两 块 石头 ， 但 不 
能 同时 取 编 号 为 1 和 3 的 两 块 石 头 ， 依 此 类 推 。 

当 题 目 中 有 “N 个 ”之 类 的 字眼 出 现时 ， 我 们 往往 可 以 从 讨论 一 些 简单 的 
特例 出 发 ， 进 而 逐渐 掌握 解 题 的 规律 : 

(1) 石头 的 数目 N= 二 1 或 者 N= 二 2 

即 只 有 一 块 或 者 两 块 石头 ， 先 取 者 即 可 一 次 取 完 所 有 的 石头 而 获胜 。 

(2) 石头 的 数目 N=3 
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图 1-15 


设 三 块 石头 排 成 一 行 ， 其 编号 依次 为 1、2、3 (如 图 1-15 所 示 ) ， 那 么 
先 取 者 若 取 走 中 间 的 2 号 石头 ， 后 取 者 只 能 取 左 边 的 1 号 石头 或 者 右边 的 3 号 
石头 ， 而 不 能 同时 取 1 号 石头 和 3 号 石头 。 那 么 必 将 剩 下 一 块 石 头 ， 先 取 者 
将 取得 最 后 的 那 块 石头 而 获胜 。 

(3) 石头 的 数目 N=4 


SEOeS 


图 1-16 


设 4 块 石头 排 成 一 行 ， 其 编号 依次 为 1、2、3、4 (如 图 1-16) ， 那 么 先 
取 者 若 取 走 2 号 石头 、3 号 石头 ， 后 取 者 只 能 取 最 左边 的 1 号 石头 或 者 最 右边 
的 4 号 石头 ， 而 不 能 同时 取 1 号 石头 和 4 号 石头 。 那 么 必 将 剩 下 一 块 石头 ， 先 
取 者 将 取得 最 后 的 那 块 石 头 而 获胜 。 

如 果 先 取 边 上 的 石头 (1 或 4) ， 那 么 这 个 局 面 就 退化 成 三 块 石头 的 情 
况 。 

(4) 石头 的 数目 N>4 

至 此 ， 我 们 发 现 了 一 个 对 称 的 规律 ， 从 前 面 对 两 块 和 3 块 石头 的 讨论 中 
不 难看 出 : 如 果 N>4， 先 取 者 取 中 间 的 一 个 〈N 为 奇数 ) 或 者 中 间 相 连 的 
两 个 〈N 为 偶数 ) ， 确 保 左右 两 边 的 石头 数目 是 一 样 的 ， 之 后 先 取 者 只 要 每 
次 以 初始 中 心 为 对 称 轴 ， 在 与 后 取 者 所 取石 头 位 置 对 称 的 地 方 取 得 数目 相 
同 的 石头 ， 就 可 以 保证 每 次 都 有 石头 取 ， 并 且 必 将 取得 最 后 的 石头 ， 赢 得 
游戏 。 

所 以 说 先 取 者 将 有 必 胜 的 策略 ! 
扩展 问题 

经 过 快速 思考 ， 你 轻松 赢得 了 这 个 游戏 ， 不 由 得 松 了 一 口气 。 但 是 面 
试 者 往往 会 稍微 修改 规则 ， 和 你 再 玩 下 去 : 

1. 若 规定 最 后 取 光 石头 的 人 输 ， 又 该 如 何 应 对 呢 ? 这 个 问题 才 是 面试 
者 真正 想 考 察 的 。 

2. 若 两 个 人 轮流 取 一 堆 石 头 ， 每 人 每 次 最 少 取 1 块 石头 ， 最 多 取 K 块 石 
头 ， 最 后 取 光 石头 的 人 赢得 此 游戏 。 

本 题 其 实 上 是 “ 牛 ” (NIM) 游戏 的 一 种 变形 ， 本 书 中 有 关 “ 牛 ”游戏 的 趣 
题 还 有 两 题 ， 这 道 题目 仅仅 是 热身 而 已 。 


1.12 NIM (2)“ 牛 ”游戏 分 析 


我 们 再 来 看 一 个 类 似 的 游戏 : 

有 N 块 石头 和 两 个 玩家 A 和 B， 玩 家 A 先 将 石头 分 成 若干 堆 ， 然 后 按照 
BABA...…. 的 顺序 不 断 轮流 取石 头 ， 能 将 剩 下 的 石头 一 次 取 光 的 玩家 获胜 。 
每 次 取石 头 时 ， 每 个 玩家 只 能 从 若干 堆 石 头 中 任 选 一 堆 ， 取 这 一 堆 石 头 中 
任意 数目 (大 于 1) 个 石头 。 

请 问 : 玩家 A 要 怎样 分 配 和 取石 头 才能 保证 自己 有 把 握 取胜 ? 
分 析 与 解法 

据说 ， 该 游戏 起 源 于 中 国 ， 经 由 当年 到 美洲 打工 的 华人 流传 出 去 。 它 
的 英文 名 字 “NIM*”* 是 由 广东 话 “ 牛 ”( 取 物 之 意 ) 音译 而 来 。 这 个 游戏 一 个 常 
见 的 变种 是 将 十 二 枚 硬币 分 三 列 排 成 [3，4，5] 再 开始 玩 。 我 们 这 里 讨论 的 
是 一 般 意义 上 的 “ 牛 ” 游 戏 。 

言 归 正 传 ， 在 面试 者 吊 吊 逼 人 的 目光 下 ， 你 要 如 何 着 手 解决 这 个 问 
题 ? 

在 面试 中 ， 面 试 者 考察 的 重点 不 是 “what” 一 一 能 否 记 住 某 道 题目 的 解 
法 ， 某 件 历 史 事 件 发 生 的 确切 年 代 ，C++ 语 言 中 关于 类 的 继承 的 某 个 规则 的 
分 支 等 。 面 试 者 很 想 知道 的 是 “how” 应 聘 者 是 如 何 思考 和 学 习 的 。 

所 以 ， 应 聘 者 得 展现 自己 的 思路 。 记 得 在 上 一 节 “NIM (1) 一 排 石头 
的 游戏 中， 我们 提 到 了 解答 这 类 问题 应 从 最 基本 的 特例 开始 分 析 。 我 们 不 
妨 再 试 一 下 ， 我 们 用 N 表 示 石 头 的 堆 数 ，M 表 示 总 的 石头 数目 。 

当 N 三 1 时 ， 即 只 有 一 堆 石 头 一 一 显然 无 论 你 放 多 少 石头 ， 你 的 对 手 都 
能 一 次 全 拿 光 ， 你 不 能 这 样 摆 。 

当 N 三 2 时 ， 即 有 两 堆 石头 ， 最 简单 的 情况 是 每 堆 石头 中 各 有 一 个 石子 
(1，1) 一 一 先 让 对 手 拿 ， 无 论 怎样 你 都 可 以 获胜 。 我 们 把 这 种 在 双方 理 
性 走 法 下 ， 你 一 定 能 够 赢 的 局 面 叫 作 安全 局 面 。 

当 N=2，M>2 时 ， 既 然 (1，1) 是 安全 局 面 ， 那 么 (1，X) 都 不 是 安 
全 局 面 ， 因 为 对 手 只 要 经 过 一 次 转换 ， 就 能 把 (1，X) 变 成 (1，1) ， 然 
后 该 你 走 ， 你 就 输 了 。 既 然 (1，X) 不 安全 ， 那 么 (2，2) 如 何 ? 经 过 分 
析 ， (2，2) 是 安全 的 ， 因 为 它 不 能 一 步 变 成 (1，1) 这 样 的 安全 局 面 。 


这 样 我 们 似乎 可 以 推理 (3，3) 、 (4，4) ,一 直到 (X，X) 都 是 安全 局 
面 。 

于 是 我 们 初步 总 结 ， 如 果 石 头 的 数目 是 偶数 ， 就 把 它们 分 为 两 堆 ， 每 
堆 有 同样 多 的 数目 。 这 样 无 论 对 手 如 何 取 ， 你 只 要 保证 你 取 之 后 是 安全 局 
面 (X，X) ， 你 就 能 赢 。 

好 ， 如 果 石 头 数 目 是 奇数 个 呢 ? 

当 M= 二 3 的 时 候 ， 有 两 种 情况 ， (2，1) 、 (1，1，1) ， 这 两 种 情况 
都 会 是 先 拿 者 赢 。 

当 M=5 的 时 候 ， 和 M= 三 3 类 似 。 无 论 你 怎么 摆 ， 都 会 是 先 拿 者 赢 。 

若 M 二 7 呢 ? 情况 多 起 来 了 ， 头 有 些 晕 了 ， 好 像 也 是 先 拿 者 赢 。 

我 们 在 这 里 得 到 一 个 很 重要 的 阶段 性 结论 : 

当 摆 放 方 法 为 (1，1，...，1) 的 时 候 ， 如 果 1 的 个 数 是 奇数 个 ， 则 先 
拿 者 赢 ; 如果 1 的 个 数 是 偶数 个 ， 则 先 拿 者 必 输 。 

当 摆 放 方 法 为 (1，1，...，1，X) (多 个 1， 加 上 一 个 大 于 1 的 X) 的 
时 候 ， 先 拿 者 必 赢 。 因 为 : 

如 果 1 有 奇数 个 ， 先 拿 者 可 以 从 (X) 这 一 堆 中 一 次 拿 走 X 一 1 个 ， 剩 下 
偶数 个 1 一 一 接 下 来 动手 的 人 必 输 。 

如 果 有 偶数 个 1， 加 上 一 个 X， 先 拿 者 可 以 一 次 把 X 都 拿 光 ， 剩 下 偶数 
个 1] 一 一 接 下 来 动手 的 人 也 必 输 。 

当然 ， 游 戏 是 两 个 人 玩 的 ， 还 有 其 他 的 各 种 摆 法 ， 例 如 当 M= 三 9 的 时 
候 ， 我 们 可 以 摆 为 (2，3，4) 、 (1，4，4) 、 (1，2，6) ， 等 等 。 这 么 
多 堆 石 头 ， 它 们 既 互 相 独 立 ， 又 互相 牵制 ， 那 如 何 分 析 得 出 致胜 策略 呢 ? 
关键 是 找到 在 这 一 系列 变化 过 程 中 有 没有 一 个 特性 始终 决定 着 输赢 。 这 个 
时 候 ， 就 得 考验 一 下 真 功 夫 了 ， 我 们 要 想 想 大 学 一 年 级 数理 逻辑 课 上 学 的 
异 或 (XOR) 运算 。 异 或 运算 规则 如 下 : 

XOR (0, 0) =0 

XOR (1, 0) =1 

XOR (1, 1) =0 

首先 我 们 看 整个 游戏 过 程 ， 我 们 从 N 堆 石头 (M1 ，M,，...，M,) 开 
台 ， 双 方 斗 智 斗 勇 ， 石 头 一 直 递 减 到 全 部 为 零 (0, 0, ...，0) 。 


当 M 为 偶数 的 时 候 ， 我 们 的 取胜 策略 是 把 M 分 成 相同 的 两 份 ， 这 样 就 能 
取胜 。 

开始 : (Mi: ，MI ) 

中 途 : (MI ，M,) 


它们 异 或 的 结果 是 XOR (M1,， M1) =0 
对 手 无 论 坛 样 从 这 堆 石 头 中 取 ， 两 堆 石头 的 数目 
定 会 变 得 不 相等 ，XOR (M1:,， M,) ! =0 


我 方 : (M, ，M, ) ”我 方 还 是 把 两 堆 变 相等 。XOR (M， ，M, ) =0 


最 后 : 《〈0，0) 我 方 取 胜 

类 似 的 ， 若 M 为 奇数 ， 把 石头 分 成 (1，1，...，1) 奇数 堆 时 ，XOR 
(1L，1，.…，1) 十 归 人 上 二 0。 而 这 时 候 ， 对 方 可 以 取 走 一 整 堆 ，XOR 
(1, 1, ..., 1) [偶数 个 ] 二 0， 如 此 下 去 ， 我 方 必 输 。 

我 们 推广 到 M 为 奇数 ， 但 是 每 堆 石头 的 数目 不 限于 1 的 情况 ， 看 看 XOR 


值 的 规律 : 
..，M,) XOR (Mi, MM, ..., M,) =? 


开始 : (MI; ，M,，. 
中 途 : (Mi ，M ，..M ) XOR (MI ，M ',..., M, ', 
一 7? 


最 后 : (0，0，...，0) XOR (0，0，...，0) =0 


不 乎 的 是 ， 可 以 看 出 ， 当 有 奇数 个 石头 时 ， 无 论 你 如 何 分 堆 ，XOR 
(Mi ，M, ，.…，M ) 总 是 不 等 于 0! 因为 必然 会 有 奇数 堆 有 奇数 个 石头 
(二 进 制 表示 最 低位 为 1) ， 异 或 的 结果 最 低位 肯定 为 1。[ 结 论 1] 

再 不 幸 的 是 ， 还 可 以 证 明 ， 当 XOR (MI, M,，, ...，M,) ! =0 时 ， 


我 们 总 是 只 需要 改变 一 个 Mi 的 值 ， 就 可 以 让 XOR (MI ，M，，.…，Mi 


内 \ 和 EE 八 而 
'，...，M. ) 二 0。[ 结 论 2] 

更 不 笠 的 是 ， 又 可 以 证 明 ， 当 XOR (Mi ，M2 ，. 
任何 一 个 M 值 的 改变 〈 取 走 石头 ) ， 都 会 让 XOR (Mi ，M， ，.. 
'，...，M, ) ! = 二 0。[ 结 论 3] 

有 了 这 三 个 “不 幸 ” 的 结论 ， 我 们 不 得 不 承认 ， 当 M 为 奇数 时 ， 无 论 怎样 
分 堆 ， 总 是 先 动手 的 人 赢 。 

还 不 信 ? 那 我 们 试 试看 : 当 M=9， 随 机 分 堆 为 (1，2，6) : 


9》 M, ) 一 0 时 ， 对 
.Mi 


开始 : (1，2，6) 


0 1] 即 XOR (1, 2, 6) !=0 


B 先 手 : (1，2，3) ， 即 从 第 三 堆 取 走 三 个 ， 得 到 (1，2，3) 
1=001 


2 
3=011 
XOR=000 所 以 ; XOR (C1, 2; 引 
中方 ‘(13 2; 2) XOR (1; 2; 2 S06 
B 方 : (0, 2, 2) XOR (0, 2, 2) =0 
ye A 方 继续 顽抗 .….…. 


B 方 最 后 : (0, 0, 0) ，XOR (0, 0, 0) =0 

好 了 ， 通 过 以 上 的 分 析 ， 我 们 不 但 知道 了 这 类 问题 的 答案 ， 还 知道 了 
游戏 的 规律 ， 以 及 如 何 才能 赢 。XOR， 这 个 我 们 很 早 就 学 过 的 运算 ， 在 这 
里 帮 了 大 忙 >。 我 们 应 该 对 XOR 说 Orz 才 对 ! 

有 兴趣 的 读者 可 以 写 一 个 程序 ， 返 回 当 输入 为 (M1 ,，M,，...，M,) 
的 时 候 ， 到 底 如 何 取石 头 ， 才 能 有 赢 的 可 能 。 比 如 ， 当 输入 为 3，4，5) 
的 时 候 2， 程 序 返 回 (1，4，5) 一 一 这 样 就 转 败 为 有 性 了 ! 


扩展 问题 


1. 如 果 规 定 相反 ， 取 光 所 有 石头 的 人 输 ， 又 该 如 何 控制 局 面 ? 
2. 如 果 每 次 可 以 挑选 任意 K 扒 ， 并 从 中 任意 取石 头 ， 又 该 如 何 找到 必 
胜 策略 呢 ? 


1.13 NIM (3) 两 堆 石 头 的 游戏 


在 前 面 两 个 题目 中 ， 我 们 讨论 了 被 称 为 “NIM ( 拓 ) “的 这 种 游戏 及 其 变 
种 的 玩法 和 必 胜 策略 ， 下 面 我 们 将 讨论 这 类 游戏 的 另 一 种 有 趣 的 玩法 : 

假设 有 两 堆 石 头 ， 有 两 个 玩家 会 根据 如 下 的 规则 轮流 取石 头 : 

每 人 每 次 可 以 从 两 堆 石 头 中 各 取出 数量 相等 的 石头 ， 或 者 仅 从 一 堆 石 
头 中 取出 任意 数量 的 石头 。 

最 后 把 剩 下 的 石头 一 次 拿 光 的 人 获胜 。 

例如 ， 对 于 数量 分 别 为 1 和 2 的 两 堆 石头 ， 取 石头 的 第 一 个 玩家 必定 将 
会 输 掉 游戏 。 因 为 他 要 么 只 能 从 任意 一 堆 中 取 一 块 石 头 ， 要 么 只 能 从 两 堆 
中 各 取出 一 块 石头 。 但 无 论 他 采用 哪 种 方式 取 ， 最 后 ， 剩 下 的 石头 总 是 恰 
好 能 被 第 二 个 玩家 一 次 取 光 。 

各 定义 一 个 国 数 如 下 : 

bool nim(n,m) //n, m 分 别 是 两 堆 石 头 的 数量 

要 求 返回 一 个 布尔 值 ， 表 明 首 先 取石 头 的 玩家 是 否 能 赢得 这 个 游戏 。 
分 析 与 解法 

拿 到 这 个 题目 ， 你 也 许 会 想 ， 有 两 个 玩家 ， 有 两 种 取石 头 的 方法 ， 每 
个 人 还 必须 按照 比较 理性 的 方法 取石 头 .…… 头 绪 的 确 比 较 多 。 如 果 你 觉得 
这 个 题目 比较 难 的 话 ， 不 妨 从 简单 的 问题 入 手 ， 还 记得 以 前 学 过 的 构造 质 
数 的 “筛子 "方法 么 ? 

怎样 才能 找 出 从 2 开始 的 质数 呢 ? 我 们 先 把 所 有 数字 都 排列 出 来 : 


3 | 4 |; io | EE | 
既然 2 是 质数 ， 那 么 2 的 倍数 就 不 是 质数 ， 那 我 们 就 把 它们 都 “ 箭 掉 ”: 
"|2|3|+* DE 
那么 下 一 数字 3， 它 没有 被 般 掉 ， 意 味 着 它 不 能 被 小 于 它 的 数 整 除 ， 所 
以 它 就 是 一 个 质数 ! 于 是 我 们 再 把 3 的 倍数 筛 掉 ， 得 到 下 表 : 


PT TT TT TT eT eT 


A 2 6 9 12 19. 120 


7 | 8 


6| 14| 5 


5 | 短 


6|#4|5|46 vr [ssl»|™| 


如 法 炮制 ， 我 们 得 到 了 后 面 的 质数 : 5，7，... 
【解法 一 】 
回 到 这 个 NIM 的 问题 ， ee ' 筛 "一 回 ? 表 1-1 显 示 了 在 (10， 
10) 范围 内 两 堆 石 头 的 可 能 组 合 ， 由 于 它 具 有 对 称 性 ， 所 以 我 们 不 用 处 理 
另 一 半 的 表格 ， 另 外 ， 像 0) 、 (1，0) 这 样 的 特殊 情况 已 经 处 理 
了 。 所 以 我 们 先 把 它们 得 掉 。 
表 1-1 (10，10) 范围 内 石头 可 能 的 组 合 


Ls 1,3 1,4 1;5 1.6 1 7 1,8 1, 9 1, 10 

为 公 治 2,4 2 | 2,6 Sol 2,8 2,9 2, 10 
elas | oa7 [as | a [sm| 
| es Tas [ar [as [eo [on] 
se sr se [sols 


| | | a ,8 0,9 6,10 


El ETN EY 
oo 
首先 我 们 定义 : 先 取 者 有 必 胜 策略 的 局 面 为 “安全 局 面 ”， 而 先 取 者 无 
必 胜 策略 的 局 面 为 “不 安全 局 面 ”。 
我 们 把 (1，1) ， (2，2) ，...， (10，10) 的 安全 局 面 得 掉 。 如 表 1- 
2 所 示 : 


表 1-2 ” 筛 去 安全 局 面 的 组 合 


Le | | We | Sh | i 
es er fe es [en 


es Ten 
0-40 | 

那么 这 个 表 里 最 前 面 的 一 个 组 合 就 是 (1，2) ， 通 过 简单 的 分 析 ， 我 
们 知道 这 是 一 个 必 输 到 
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达 (1，2) 这 个 局 面 的 数字 组 合 如 (1,3) ， (1, 4) ， (1, n) 等 ,都 
是 安全 局 面 一 一 我 们 可 以 把 这 些 组 合 全 部 筛 掉 ， (1，n) 都 可 以 经 过 一 步 
转换 变 成 (1，2) ， (2，m) 也 是 可 以 一 步 转换 成 (2，1) 的 〈 它 等 价 于 
(1，2) ) ， 所 以 也 要 被 得 掉 。 (Cn 十 1，n 十 2) 也 是 如 此 ， 同 样 可 以 被 得 
掉 。 这 样 我 们 的 表 就 简洁 多 了 (如 表 1-3 所 示 ) 。 


表 1-3 ”得 去 安全 局 面 的 组 合 


Ee 
7 | 6.,8 
| | 9 | 
| 
现在 表 上 的 下 一 组 数 是 什么 呢 ? 对 , 是 (3,，5) 。 和 (1，2) 一 样 ， 
这 个 没有 被 得 掉 的 组 合 就 是 我 们 的 下 一 个 不 安全 局 面 。 显 然 ， (3，5) 组 
合 的 任意 一 个 符合 规则 的 变化 都 是 一 个 “安全 局 面 ”。 
好 了 ， 得 到 了 (3， 5) 》 我 们 就 要 把 (3， n) 》 (n, 3) 3 (5, 
n) ， (n,，5) ， (3 十 n，5 十 n) 都 科 掉 。 于 是 我 们 得 到 了 表 1-4: 


表 1-4 ”安全 局 面 的 结果 


这 时 ， (4，7) 成 为 另 一 个 不 安全 局 面 ， 经 过 筛选 之 后 ， (6，10) 又 


1. al 三 1, bj 三 2o。 
2. 若 ai ，bi ，...，a%_1 ，b,_1 已 经 求 得 ， 则 定义 a 为 未 出 现在 这 2n 
一 2 个 数 中 的 最 小 整数 。 
3. b, 三 an 十 Do 
做 成 表 就 是 如 表 1-5 所 示 ) : 
表 1-5 ”安全 局 面 表 


因此 ， 我 们 可 以 根据 上 述 定义 ， 从 第 一 个 不 安全 局 面 (1，2) 出 发 ， 
依次 向 上 推理 ， 直 到 推理 出 足够 的 不 安全 局 面 来 判定 一 个 随机 给 定 的 状态 
下 ， 先 取 者 是 否 能 够 获胜 。 具 体 做 法 就 是 设 两 堆 石 头 中 较 小 那 堆 的 数量 为 
x， 从 (1，2) 开始 向 上 推理 ， 直 到 a, 大 于 等 于 x 为 止 ， 此 时 我 们 就 得 到 了 
an 小 于 等 于 x 的 所 有 不 安全 局 面 。 如 果 x 恰好 等 于 某 一 不 安全 局 面 的 a, 值 ， 


只 要 根据 另 一 堆 石 头 的 数量 是 否 恰好 与 x 对 应 的 b, 相等 ， 就 可 以 判断 出 先 取 
者 是 否 有 办 法 赢得 游戏 。 如 果 x 不 等 于 任意 一 个 不 安全 局 面 的 a 值 ， 则 先 取 
者 必 胜 。 

根据 上 述 分 析 ， 可 以 写 出 如 下 代码 : 
代码 清单 1-18 ”C# 自 底 向 上 的 解法 


static bool nim(int x, int y) 


{ 


// speical case 
if(x == y) 
{ 
return true; // I win 
} 


// swap the number 
if(x > y) 
{ 
int t= x; x= yy= t; 
} 


// basic cases 
if(x == 1 55 Y == 2) 
{ 
return false; // I lose 
} 


ArrayList al = new ArrayList (); 
al.Add (2); 


int n= 1 


int delta = 1; 
int addition = 0; 


while(x > n) 

{ 
// find the next n; 
while(al.IndexOof (++n) != -1); 
deltat++; 
al.Addi{n + delta); 
additiont++; 


if{al.Count > 2 && addition > 100) 

{ 
// 因为 数组 a1I 中 保存 着 n 从 1 开始 的 不 安全 局 面 ， 所 以 在 
// 数组 元 素 个 数 超过 100 时 删除 无 用 的 不 安全 局 面 ， 使 数组 
// 保持 在 一 个 较 小 的 规模 ， 以 降低 后 面 Indsexof () 函数 调用 
// 的 时 间 复 杂 度 。 
ShrinkArray (al, n); 
addition = D; 


解法 看 上 去 虽然 直观 ， 但 是 效率 并 不 高 ， 因 为 它 是 一 种 自 底 向 上 推理 
的 算法 ， 算 法 的 复杂 度 为 O (N) 。 

【解法 二 】 

我 们 看 看 能 否 找 出 不 安全 局 面 的 规律 ， 最 好 有 一 个 通用 的 公式 可 以 表 
示 。 所 有 不 安全 局 面 ({<1, 2>,，<3, 5>,， <4, 7>, <6, 10 
>>，...}) 的 两 个 数 合 起 来 就 是 所 有 正 整数 的 集合 ， 且 没有 重复 的 元 素 ， 而 
且 所 有 不 安全 局 面 的 两 个 数 之 差 的 绝对 值 合 起 来 是 所 有 正 整数 的 集合 ， 且 
没有 重复 的 元 素 ， 如 : 2 一 1=1,， 5 一 3==2, 7 一 4==3, 10 一 6 二 4, ... 

看 来 不 安全 局 面 是 有 规律 的 。 的 确 ， 我 们 可 以 证 明 有 一 个 通 项 公式 能 
计算 出 所 有 不 安全 局 面 ， 即 : 


an = [a * n], bs = [b * n]， 【〈[] 表示 对 一 个 数 取 下 整数 ， 如 : [1.2] = 1) 
a = (LT + “sqrt(5)) A 2 
Dem (3 Mt eart (oY “AR2 

具体 证 明 见 文 后 附 1。 


有 了 通 项 公式 ， 我 们 就 能 更 加 简明 地 实现 函数 bool nimn，m)， 这 个 函 
数 的 时 间 复 杂 度 为 O (1) 。 
代码 清单 1-19 


if (n m) 1 1 两 堆 石 头 数 量 相 同 


wap (Nn, m); // 我 们 假设 所 有 的 状态 <x, y> 中 x<=y， 如 果 n>m， 则 交换 二 者 


if(m - nn == long) floor(n * a)) flocoor 为 取 下 整数 的 操作 符 


解法 二 将 算法 的 复杂 度 降低 到 了 O (1) ， 由 此 可 见 ， 掌 握 良好 的 数学 
思维 能 力 ， 往 往 能 在 解决 问题 时 起 到 事半功倍 的 效果 。“ 牛 ”游戏 还 有 许多 
有 趣 的 变形 和 扩展 ， 感 兴趣 的 读者 不 妨 思考 一 些 新 的 游戏 规则 ， 并 尝试 寻 
找 一 下 对 应 的 必 胜 策略 。 
扩展 问题 

1. 现在 我 们 已 经 给 出 了 一 个 判断 先 取 者 是 否 能 够 最 终 赢得 游戏 的 判断 
国 数 ， 但 是 ， 游 戏 的 乐趣 在 于 过 程 ， 大 家 能 不 能 根据 本 题 的 思路 给 出 一 个 
赢得 游戏 的 必 胜 策略 呢 ? 即 根据 当前 石头 个 数 ， 给 出 当前 玩家 下 一 步 要 怎 
么 取石 头 才能 必 胜 。 

2. 取石 头 的 游戏 已 经 不 少 了 ， 但 是 我 们 还 有 一 种 游戏 要 请 大 家 思考 ， 
我 们 姑且 叫 它 NIM (4) : 

两 个 玩家 ， 只 有 一 堆 石 头 ， 两 人 依次 拿 石 头 ， 最 后 拿 光 者 为 赢家 。 取 
石头 的 规则 是 : 

(a) 第 一 个 玩家 不 能 拿 光 所 有 的 石头 。 

(b) 第 一 次 拿 石 头 之 后 ， 每 人 每 次 最 多 只 能 拿 掉 对 方 前 一 次 所 拿 石 头 
的 两 倍 。 


那么 ， 这 个 游戏 有 没有 必 胜 的 算法 ? (提示 : 好 像 和 Fibonacci 数 列 有 
关 。) 
【 附 1】 解法 二 的 证 明 
准备 

我 们 将 两 堆 石 头 的 数目 记 作 <a，b> 之 。 对 任意 正 整 数 a， 如 果 <a，Pbi 
> 和 <a，b, > 都 是 不 安全 局 面 ， 则 bi 二 b。 (假设 b >b, ， 则 先 取 者 可 以 
通过 在 <a，bi > 中 拿 bi 一 b; 个 石头 来 让 对 手 达 到 <a，b，, > 的 不 安全 局 
面 ， 这 与 没有 必 胜 策略 矛盾 ， 所 以 说 a 和 b 是 一 一 对 应 的 ) 。 
定义 

上 工 二 {<al ，b, >|<a ，b > 是 不 安全 局 面 }={<1，2>，<3，5 
,<4, 7>>,， <6, 10>, ...} 

mn A={a, a, ..., nn}, B,={b:, b,, b,} 

A 二 {al;， a0) ... 5 dn; ...} 

mn B={b;, by, ..., b,, ...} 

四 D 为 除 0 以 外 的 自然 数 集 

因为 对 称 性 和 a, 三 b, 时 为 安全 局 面 ， 我 们 可 以 定义 an <b, ， 同 时 还 可 
以 定义 an <aj 十 1 =1，2，3，...) 。 由 “准备 * 中 的 结论 我 们 知道 AnB= 
中 (否则 存在 zx 人 AnB， 使 得 <a，x> ，<x，b> (其 中 aEA, bEB, a<x 
<b) 都 是 不 安全 局 面 ， 这 与 “准备 ”中 的 结论 矛盾 ) 。 后面 我 们 还 将 看 到 
AUB=N (AN 是 0 除外 的 自然 数 集 ) 。 
证 明 

从 解法 一 中 我 们 得 知 ， 所 有 的 不 安全 局 面 <a, ，b, > 都 满足 : au 十 n= 
b, ， 且 au 二 min (N 一 A_1 UB。， 1; ) ， 接 下 来 我 们 将 采用 数学 归纳 法 来 证 
明 这 个 结论 : 

1. 显然 n 二 1 时 ， 结 论 成 立 ，; 

n 二 1 时 ， 根 据 定 义 得 a =1，bi; =2， 记 作 <1，2>。 按 照 游戏 规则 ， 
先 取 者 要 么 取 光 其 中 一 堆 石 头 ， 要 么 从 第 二 扒 中 取出 一 块 石 头 ， 要 么 从 两 
堆 中 各 取 一 块 石 头 。 无 论 先 取 者 怎么 取 ， 后 取 者 都 将 取得 最 后 的 石头 而 获 
胜 。 


2. 假设 n<k (k>1) 时 结论 成 立 ， 我 们 现在 来 证 明 n 二 k 时 结论 也 成 
立 ， 即 a 十 k= 二 bl ， 其 中 a 二 min (N 一 Ai; UB_1) 。 为 了 证 明 方 便 ， 
记 a=al o 

(a) 显然 <a，x> (x 之 二 a) 都 是 安全 局 面 (根据 a 定义 和 归纳 假 
设 ) 。 

(b) <a, a 十 x> (x 二 1，2，...，k 一 1) 是 安全 局 面 ， 因 为 总 可 以 分 别 
从 两 堆 石 头 中 拿 走 a 一 a ， 以 到 达 不 安全 局 面 <a,，a, 十 x>。 

(c) <a，a 十 k> 是 不 安全 局 面 ， 可 以 通过 枚 举 所 有 取石 头 的 可 能 情况 
来 证 明 ， 如 下 所 示 : 

i。 从 a 中 取 走 a 一 x 块 石头 (x 二 1，2，...， a 一 1，a) ， 剩 下 <x，a 十 k> 
是 安全 局 面 。 因 为 即使 存在 不 安全 局 面 <x，x 十 t>， 因 为 有 x<a,，t<k， 所 
以 x 十 ta 十 ko 

计 ，。 从 a 十 k 中 取 ， 只 能 到 达 不 安全 局 面 。 前 面 (a) 和 (b) 已 经 证 明了 
<a，x> (x 过 二 a) 和 <a, a 十 x> (x 二 1，2，...，k 一 1) 都 是 安全 局 面 。 

过 分 别 从 两 堆 中 取 x 块 石头 (x 二 1，2，...，a) ， 剩 下 的 <al 一 X，al， 
十 k 一 x> 一 定 是 安全 局 面 。 因 为 假设 存在 <a 一 x，al, 一 Xx 十 t> 的 不 安全 局 
面 ， 由 于 有 t<k， 所 以 al, 一 x 十 t<al 十 k 一 x， 假 设 不 成 立 。 

(d) <a,， a 十 x> (x>k) 是 安全 局 面 : 

i. 由 (c) 可 知 ， 在 第 二 堆 中 取 x 一 k 即 可 达到 不 安全 局 面 <a，a 十 k>。 

所 以 ， 当 n= 二 k 时 ， 有 b, = 二 a 十 k， 其 中 a 二 min (N 一 AL_1 UB._i 
) ， 结 论 成 立 。 由 数学 归纳 法 知 ， 对 任意 正 整数 n 原 结论 成 立 。 

推论 : AUB=N (读者 可 以 用 反 证 法 证 明 ) ， 又 因为 我 们 已 经 得 到 
AnB 二 9g， 所 以 A\B 是 N 的 一 个 分 划 。 这 个 推论 会 在 下 面 的 求解 中 应 用 到 。 
求解 不 安全 局 面 

我 们 已 经 得 到 不 安全 局 面 的 一 些 性 质 ， 现 在 来 求解 不 安全 局 面 。 

定理 : 如 果 正 无 理 数 a，b 满 足 1/a 十 b= 二 1， 则 
{[a*njInENMH{[b*njInEN} 是 N 的 一 个 分 划 ， 其 中 [为 高 斯 记号 ，[a*n] 表 示 对 
a*n 向 下 取 整 。 

现在 我 们 就 根据 上 述 定理 来 构造 一 个 满足 不 安全 局 面 的 分 划 : 

取 无 理 数 a，b， 其 满足 La 十 ab 王 1; 

令 x 三 [arn]，y =[b*n], y, 一 X +n (n 王 1，2，3，4，...) 


则 {x, IhENY{y, IhEN} 是 N 的 一 个 分 划 。 我 们 在 加 上 一 个 限制 条 件 : 
令 y = 二 x 十 n， 即 [b*n] 二 [a*n] 十 n 二 [ (a 十 1) *n]， 因 为 这 个 等 式 对 所 有 的 
nN 成 立 ， 所 以 必 有 b==a 十 1 (否则 总 能 找到 足够 大 的 n 使 得 等 式 不 成 
立 ) 。 


求解 二 元 一 次 方程 组 : 


下 面 我 们 将 看 到 这 个 x ，y, 就 是 我 们 要 求 的 a ，b， : 

1. 显然 x; 二 a ， 且 满足 相同 的 递 推 关系 ， 所 以 我 们 只 需 证 明 x, 二 min 
(N—Xn=r UYn=1) 3 

2. 其 中 XxX, 三 {xi ，x ，...， XX }，Y 三 {yi ，y2 ，...，yn}， 这 是 显然 
9， 否 则 ， 由 于 x, 、y 具有 严格 的 单调 性 ， 且 y, >>x,， 那 么 N 一 XUY 将 会 
不 为 空 ， 与 X/Y 是 N 的 划分 矛盾 。 

所 以 xz ，yn 就 是 我 们 所 要 求 的 a, ，b, 。 

即 a, 三 [axn]，b, 三 [b*n]， 其 中 : 


_1+V5 

号 
3+V5 

= 7 


至 此 ， 对 于 任意 给 定 的 一 个 状态 <x，y> ， 我 们 都 可 以 通过 判断 x 是 否 
于 某 个 [asn]， 且 y 是 否 等 于 对 应 的 [b*n]， 来 判断 <x，y> 是 否 为 一 个 不 安全 
局 面 。 或 者 我 们 也 可 以 通过 判断 y 一 x (假设 x 之 二 y) 是 否 等 于 [al]* (y 一 x) 
来 判断 <x，y> 是 否 为 一 个 不 安全 局 面 。 同 理 ， 知 <x，y> 是 一 个 安全 局 面 ， 
我 们 也 可 以 通过 这 个 判定 法 来 取 合适 数量 的 石头 ， 从 而 令 对 手 达到 某 一 个 
不 安全 局 面 。 


【 附 2】Python 的 程序 解法 


前 面 提 到 的 解法 一 的 代码 是 由 C# 写 成 的 ，MSRA 里 有 位 工程 师 给 出 了 
一 个 Python 的 解法 ， 思 路 与 之 类 似 ， 大 家 不 妨 分 析 一 下 哪 种 解法 效率 更 高 ? 
下 面 是 自 底 向 上 解法 的 Python 源 代 码 : 
代码 清单 1-20 


// Comments: Python code 


false table = dict() 
true table = dict() 


def 


def 


def 


def 


possible next moves{(m, n): 
for i in range(0, m): 


yield(i, n) 
for i in range(0, n): 
EE ms 
yield(m, i) 
else: 


yield(i, m) 
for i in range(0, m): 
yield(i, n - m + i) 


can_reach(m, n, ml, nl): 

if m == ml and n == nl: 
return False 

if m== ml or n == nl or m- ml == Nn- nl: 
return True 

else: 
return False 


quick check(m, n, name): 
for k,v in false table.items () : 
if can reach(m, n, v[1] {0)], vi[1] (1])): 
true table[name] = (True, v[1]) 
return (True, v[1]) 
return None 


nim(m, n): 
"+ 
mn=n, m 
name = str(m) + ‘+' + str(n) 


if name in false table: 
return false table[name] 

if name in true table: 
return true table[name] 


check = quick check(m, n, name) 
if check: 
return check 


三 OF jssible in possible next moves{m, n) 
r = nim{possible[0], possible[1]) 
if r[0] == False 
trus table[nams] = (True ssible) 
return {True, ssible) 
sl11if can reach{(m, esE 下 ] |[ 坊 3 [二 ] 上 3 
true table[name] = {True, r[1]) 
return {True, r[1]) 
false table[name] = (False (m, n)) 
return (False (m, n)) 


###for tes g 
Ist assert falsel n) 
for ssible In possible next ves{m, n) 
size = size + 1 
r = niml{(possible[0] ssible[1]) 
IE r[0] 上 = True 
rint 'error!l', n, "shoul se falses but it has false s n = 
Eossibles 
return 
rint "es SiZzZe ssible es are checkedl! 


很 快 ， 这 位 工程 师 又 想 出 了 另 一 种 解法 ， 不 过 这 次 他 不 是 从 n= 二 1 的 不 
安全 局 面 自 底 向 上 推理 的 ， 而 是 反 其 道行 之 ， 自 顶 向 下 查找 ， 代 码 如 下 ， 
读者 不 妨 研究 一 下 : 
代码 清单 1-21 


public class Result 
{ 
public override string ToStringf() 
{ 
string ret = string.Format ("{0} ({1}, {2})", State.ToString(), X, Y); 
return ret; 
) 
public Result (bool s, vint x, uint y) 
{ 
State = 37 
X= X7 
Y = y;? 
} 
public bool State; 
public vint X, Y; 
} 


public static Result nim(uint m, uint n) 
{ 
if{(m == nn || m == 0 1In== 0) 
{ 
return new Result (true, m, n); 
} 
if{m < n) 
{ 
uint tmp = m; 
m= n; 
n = tmp;? 
) 
Result[,] Matrix = new Result[m, n]; 
for{uint i = 0; i < n; i++) 
{ 
for(uint smn j++) 
{ 
if (Matrix[j, i] == null) 
{ 
PropagateralseResult (m, n, 3, i, Matrix); 
if{(Matrix[lm - i, n -~- 1] != null) 
{ 


return Matrix{m - 1, nn- 1];} 


} 
} 


return Matrix{m - i, n- 11; 


static void PropagateFalseResult (uint m, uint n, uint x, uint Y，Rassualz[,] 
Matrzix) 


Matrix[x,y] = new Result (false, x + 1 
Result tResult = new Result (true, x + 1, vy 
for(vint i = y+ 1; 1 < n; it++) 


Matrix[x, 2] tResult? 
} 
for (uint 二 = x+ 1; i < m; i++) 


ttResult; 
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Matrix[x + i, y + i] = tResult; 


~ Hh 
0 
村 
Eo 
用 
叶 
[a 
[a 
中 
* 
+ 
[mn 
[ad 
人 
习 
~ 
li 
+ 
+ 


Matrix[i, x] = tResult; 


1.14 连连 看 游戏 设计 


连连 看 是 一 种 很 受 大 家 欢迎 的 小 游戏 。 微 软 亚洲 研究 院 的 实习 生 们 就 
曾经 开发 过 一 个 类 似 的 游戏 一 一 Microsoft Link-up。 


WW Microsoft Link-up 
议 项 


图 1-17 连 连 看 游戏 示意 图 


图 1-17 为 Microsoft Link-up 的 一 se 
用 线 ( 连 线 抛 的 变 不 能 多 于 两 个 ) 连 到 一 起 ， 那 么 这 两 个 头像 就 会 消 掉 ， 
当 所 有 的 头像 全 部 消 掉 的 时 候 ， 游 戏 成 功 结束 。 游 戏 头 像 有 珍稀 动物 、 京 
剧 脸谱 等 。Microsoft Link-up 还 支持 用 户 输入 的 图 像 库 ， 微 软 的 同事 们 曾经 
把 新 员工 的 漫画 头像 加 到 这 个 游戏 中 ， 让 大 家 在 游戏 之 余 也 互相 熟悉 起 
来 。 
ee 你 会 怎么 做 呢 ? 要求 说 明 : 
.怎样 用 简单 的 计算 机 模型 来 描述 这 个 问题 ? 
， 怎样 判断 两 个 图 形 能 否 相 消 ? 
3. 怎样 求 出 相同 图 形 之 间 的 最 短路 径 (转弯 数 最 少 ， 路 径 经 过 的 格子 
数目 最 少 ) 。 
4. 怎样 确定 目前 是 处 于 死 锁 状态 ， 如 何 设计 算法 来 解除 死 锁 ? 


分 析 与 解法 

连连 看 游戏 的 设计 ， 最 主要 包含 游戏 局 面 的 状态 描述 ， 以 及 游戏 规则 
的 描述 。 而 游戏 规则 的 描述 就 对 应 着 状态 的 合法 转移 (在 某 一 个 状态 ， 有 
哪些 操作 是 满足 规则 的 ， 经 过 这 些 满足 规则 的 操作 ， 会 到 达 哪 些 状态 ) 。 
所 以 ， 自 动机 模型 适合 用 来 描述 游戏 设计 。 

下 面 是 一 个 参考 的 连连 看 游戏 的 伪 代 码 : 
代码 清单 1-22 

生成 游戏 初始 局 员 


Grid preClick = NI 
while (游戏 没有 结束 ) 
{ 


JLL, curClick = NULL; 


监听 用 户 动作 


if (用 户 点 击 格子 (x，y)， 且 格子 (x，y) 为 非 空格 子 ) 
PreClick = curClick; 
curClick.Pos = (x, y); 
if (preClick != NULL && curClick != NULL 
g& preClick.Pic == curClick.Pic 


g& FindPath (preClick, curClick) != NULL) 


显示 两 个 格子 之 间 的 消去 路 径 
消去 格子 preClick, curClick; 


preClick = curClick = NULL; 


从 上 面 的 整体 框架 可 以 看 到 ， 完 成 连连 看 游戏 需要 解决 下 面 几 个 问 
题 : 

1. 生成 游戏 初始 局 面 。 

2. 每 次 用 户 选择 两 个 图 形 ， 如 果 图 形 满足 一 定 条 件 (两 个 图 形 一 样 ， 
且 这 两 个 图 形 之 间 存 在 少 于 3 个 弯 的 路 径 ) ， 则 两 个 图 形 都 能 消 掉 。 给 定 具 
有 相同 图 形 的 任意 两 个 格子 ， 我 们 需要 寻找 这 两 个 格子 之 间 在 转弯 最 少 的 
情况 下 ， 经 过 格子 数目 最 少 的 路 径 。 如 果 这 个 最 优 路 径 的 转弯 数目 少 于 3， 
则 这 两 个 格子 可 以 消去 。 

3. 判断 游戏 是 否 结束 。 如 果 所 有 图 形 全 部 消去 ， 游 戏 结束 。 

4. 判断 死 锁 ， 当 游戏 玩家 不 可 能 再 消去 任意 两 个 图 像 的 时 候 ， 游 戏 进 
入 “ 死 锁 ”状态 。 如 图 1-18， 该 局 面 中 已 经 不 存在 两 个 相同 的 图 片 相 连 的 路 径 
转弯 数目 小 于 3 的 情况 。 


在 死 锁 的 情况 下 ， 我 们 也 可 以 暂时 不 终止 游戏 ， 而 是 随机 打 乱 局 面 ， 
打破 “ 死 锁 ”局 面 。 


图 1-18 ”连连 看 死 锁 的 情况 


首先 思考 问题 : 怎样 判断 两 个 图 形 能 否 相 消 ? 在 前 面 的 分 析 中 ， 我 们 
已 经 知道 ， 两 个 图 形 能 够 相 消 的 充分 必要 条 件 是 这 两 个 图 形 相同 ， 且 它们 
之 间 存 在 转弯 数目 小 于 3 的 路 径 。 因 此 ， 需 要 解决 的 主要 问题 是 ， 怎 样 求 出 
相同 图 形 之 间 的 最 短路 径 。 首 先 需 要 保证 最 短路 径 的 转弯 数目 最 少 。 在 转 
弯 数 目 最 少 的 情况 下 ， 经 过 的 格子 数目 也 要 尽 可 能 地 少 。 

在 经 典 的 最 短路 径 问 题 中 ， 需 要 求 出 经 过 格子 数目 最 少 的 路 径 。 而 这 
里 ， 为 了 保证 转弯 数目 最 少 ， 需 要 把 最 短路 径 问 题 的 目标 函数 修改 为 从 一 
个 点 到 另 一 个 点 的 转弯 次 数 。 虽 然 目 标 函 数 修改 了 ， 但 算法 的 框架 仍然 可 
以 保持 不 变 。 广 度 优先 搜索 是 解决 经 典 最 短路 问题 的 一 个 思路 。 我 们 看 看 
在 新 的 目标 函数 〈 转 弯 数 目 最 少 ) 下 ， 如 何 用 广度 优先 搜索 来 解决 图 形 A 

(xi ，y] ) 和 图 形 B (x, ，y, ) 之 间 的 最 短路 径 问 题 。 

首先 把 图 形 A (xi ，y; ) 压 入 队列 。 

然后 扩展 图 形 A (xi ，yi; ) 可 以 直线 到 达 的 格子 〈 即 图 形 A (xj ，yi 
) 可 以 通过 转变 数目 为 0 的 路 径 (直线 ) 到 达 这 些 格子 ) 。 假 设 这 些 格子 为 
集合 Sy ，Su 二 Find (xj ，yi; ) 。 如 果 图 形 B (x, ，y, ) 在 集合 So 中 ， 则 结 
束 搜索 ， 图 形 A 和 B 可 以 用 直线 连接 。 

否则 ， 对 于 所 有 So 集合 中 的 空格 子 (没有 图 形 ) ， 分 别 找到 它们 可 以 
直线 到 达 的 格子 。 假 设 这 个 集合 为 S; 。S] = 二 {Find (p) lpESo}。S1 包含 了 
So ， 我 们 令 S1 “==S1 一 So ， 则 S11 “ 中 的 格子 和 图 形 A (xi ，y1 ) 可 以 通过 
转变 数目 为 1 的 路 径 连 起 来 。 如 果 图 形 B (x, ，y, ) 在 S1 “中 ， 则 图 形 A 和 
B 可 以 用 转弯 数目 为 1 的 路 径 连 接 ， 结 束 搜索 。 


否则 ， 我 们 继续 对 所 有 S; “集合 中 的 空格 子 (没有 图 形 ) ， 分 别 找 出 
它们 可 以 直线 到 达 的 格子 ， 假 设 这 个 集合 为 Ss, ，S, = 二 Find{Find (p) |pESi 
' }。S, 包含 了 So 和 Si ， 我 们 令 S,，'" =S, 一 Su 一 $1 二 S, 一 So 一 S1 '。 集 
合 S,， ”是 图 形 A (xi ，y1 ) 可 以 通过 转弯 数目 为 2 的 路 径 到 达 的 格子 。 如 果 
图 形 B (x, ，y, ) 在 集合 Ss。" 中 ， 则 图 形 A 和 B 可 以 用 转变 数目 为 2 的 路 径 
和 连接， 否则 图 形 A 和 B 不 能 通过 转弯 小 于 3 的 路 径 连 接 。 

在 扩展 的 过 程 中 ， 只 要 记 下 每 个 格子 是 从 哪个 格子 连 过 来 的 (也 就 是 
转弯 的 位 置 ) ， 最 后 图 形 A 和 B 之 间 的 路 径 就 可 以 绘制 出 来 。 

在 上 面 的 广度 优先 搜索 过 程 中 ， 有 两 步 操作 : Si “= 三 Si 一 So 和 S， “= 三 
S, 一 So 一 S1。 它 们 可 以 通过 记录 从 图 形 A (xi ，y1 ) 到 该 格子 (x，y) 的 
转弯 数目 来 实现 。 开 始 ， 将 所 有 格子 (x，y) 和 格子 A (xi ，y1 ) 之 间 路 
径 的 最 少 转弯 数目 MinCrossing (x，y) 初始 化 为 无 穷 大 。 然 后 ， 仿 
MinCrossing (A) 二 MinCrossing (xi ，y1 ) 三 0， 格子 A 到 自身 当然 不 需要 
任何 转弯 。 第 一 步 扩展 之 后 ， 所 有 Su 集合 中 的 格子 的 MinCrossing 值 为 0。 
在 So 集合 继续 扩展 得 到 的 S; 集合 中 ， 格 子 X 和 格子 A 之 间 至 少 有 转弯 为 1 的 
路 径 ， 如 果 格 子 X 本 身 已 经 在 So 中 ， 那 么 ，MinCrossing (X) 二 0。 这 时 ， 
我 们 保留 转弯 数目 少 的 路 径 ， 也 就 是 MinCrossing (X) 三 MinValue 
(MinCrossing (X) ，1) 三 0。 这 个 过 程 ， 就 实现 了 上 面 伪 代 码 中 的 S 
二 $1 一 Su 。S,， ' 三 $, 一 Su 一 Sj 的 扩展 过 程 也 类 似 。 

经 过 上 面 的 分 析 ， 我 们 知道 ， 每 一 个 格子 X (x，y) ， 都 有 一 个 状态 值 
MinCrossing (X) 。 它 记录 下 了 该 格子 和 起 始 格子 A 之 间 的 最 优 路 径 的 转弯 
数目 。 广 度 优先 搜索 ， 就 是 每 次 优先 扩展 状态 值 最 少 的 格子 。 如 果 要 保证 
在 转弯 数目 最 少 的 情况 下 ， 还 要 保持 路 径 长 度 尽 可 能 地 短 ， 则 需要 对 每 一 
个 格子 X 保 存 两 个 状态 值 MinCrossing (X) 和 MinDistance (X) 。 从 格子 X 
扩展 到 格子 Y 的 过 程 ， 可 以 用 下 面 的 伪 代 码 实 现 : 

if((MinCrossing(X) + 1 < Mincrossing(Y)) || 

((MinCrossing(X) + 1 == MinCrossing(Y) && (MinDistance(X) + Dist (X,Y) < 
MinDistance(Y) ) ) 

MinCrossing(Y) = MinCrossing(X) + 1; 


MinDistance(Y) = MinDistance (X) + Dist(X, Y); 


} 


也 就 是 说 ， 如 果 发 现 从 格子 X 过 来 的 路 径 改 进 了 转弯 数目 或 者 路 径 的 长 
度 ， 则 更 新 格子 Y。 

“ 死 锁 ”问题 本 质 上 还 是 判断 两 个 格子 是 否 可 以 消去 的 问题 。 最 直接 的 
方法 就 是 ， 对 于 游戏 中 尚未 消去 的 格子 ， 都 两 两 计算 一 下 它们 是 否 可 以 消 
去 。 此 外 ， 从 上 面 的 广度 优先 搜索 可 以 看 出 ， 我 们 每 次 都 是 扩展 出 起 始 格 
子 A (xl ，y1 ) 能 够 到 达 的 格子 。 也 就 是 说 ， 对 于 每 一 个 格子 ， 可 以 调用 
一 次 上 面 的 扩展 过 程 ， 得 到 所 有 可 以 到 达 的 格子 ， 如 果 这 些 格子 中 有 任意 
一 个 格子 的 图 形 跟 起 始 格子 一 致 ， 则 它们 可 以 消去 ， 目 前 游戏 还 不 是 “ 死 
锁 ” 状 态 。 


扩展 问题 : 


1. 在 连连 看 游戏 设计 中 ， 是 否 可 以 通过 维护 任意 两 个 格子 之 间 的 最 短 
路 径 来 实现 快速 搜索 ? 在 每 一 次 消去 两 个 格子 之 后 ， 更 新 我 们 需要 维护 的 
数据 (任意 两 个 格子 之 间 的 最 短路 径 ) 。 这 样 的 思路 有 哪些 优 缺 点 ， 如 何 
实现 呢 ? 

2. 在 围棋 或 象棋 游戏 中 ， 经 过 若干 步 操作 之 后 ， 可 能 出 现 一 个 曾经 出 
现 过 的 状态 (例如 ， 围 棋 中 的 打动 ) 。 如 何在 围棋 、 象 棋 游戏 设计 中 检测 
这 个 状态 呢 ? 


1.15 “构造 数 独 


数 独 (日 语 : 数 独 ，sudoku) 是 一 个 历史 和 悠久， 最 近 又 特别 流行 的 数 
学 智力 游戏 。 它 不 仅 具 有 很 强 的 趣味 性 ， 而 且 能 锻炼 我 们 的 逻辑 思维 能 
力 。 数 独 的 “棋盘 ”是 由 九 九 八 十 一 个 小 方 格 组 成 的 。 玩 家 要 在 每 一 个 小 格 
中 ， 分 别 填 上 1 至 9 的 任意 一 个 数字 ， 让 整个 棋盘 每 一 列 、 每 一 行 以 及 每 一 
个 3x3 的 小 矩阵 中 的 数字 都 不 重复 。 

据说 “ 数 独 ”游戏 在 日 本 非常 流行 ， 在 地 铁 车 厢 和 候车 室 里 ， 每 天 都 可 
以 看 到 人 们 埋头 于 游戏 的 情景 ， 甚 至 有 专门 的 “ 数 独 ”游戏 机 出 现 。 

现在 很 多 杂志 和 报纸 上 的 游戏 专 版 也 有 数 独 栏目 ， 一 般 的 方式 是 提供 
一 个 不 完整 的 数 独 ， 让 读者 填 完 所 有 数字 。 

既然 数 独 这 个 游戏 这 么 好 玩 ， 我 们 也 写 一 个 吧 ! 图 1-19 是 作者 写 的 一 个 
数 独 游戏 的 初始 画面 : 


图 1-19 


在 面试 中 ， 由 于 时 间 的 限制 ， 面 试 者 不 会 期 望 应 聘 者 会 写 出 全 部 程 
序 ， 一般 会 要 求 回 答 设计 中 的 几 个 关键 问题 ， 例 如 : 


程序 的 大 致 框架 是 什么 ? 用 什么 样 的 数据 结构 存储 数 独 游戏 中 的 各 种 
元 素 ? 如 何 生 成 一 个 初始 局 面 ? 
分 析 与 解法 

看 到 数 独 游戏 ， 大 家 应 该 都 会 想到 用 一 个 二 维 的 数组 来 存储 ， 每 个 元 
素 对 应 数 独 中 的 一 个 数 。 但 考虑 到 每 一 个 格子 又 具有 若干 个 属性 (是 否 5 
以 修改 等 ) ， 我 们 可 以 把 每 一 个 格子 抽象 为 一 个 对 象 ， 可 以 把 整体 看 成 9x9 
的 格子 对 象 。 为 什么 不 使 用 9 个 3x3 的 形式 来 存储 呢 ? 这 主要 取决 于 ， 数 据 
结构 是 否 方便 我 们 去 计算 游戏 的 规则 (每 行 每 列 的 每 个 3x3 块 都 刚好 含有 数 
字 1~9 各 一 个 ) 。 

确定 数据 结构 后 ， 我 们 的 任务 就 是 要 生成 一 个 游戏 的 初始 局 面 。 如 果 
随机 地 把 1~9 的 数字 散布 在 9x9 的 格子 上 ， 这 看 起 来 也 是 可 以 的 ， 但 我 们 不 
能 保证 这 个 初始 局 面 有 解 ， 粗 略 计算 一 下 ， 随 机 生成 的 数字 能 满足 数 独 条 
件 的 几率 还 是 很 低 的 ， 大 约 远 远 小 于 10-20 ， 估 计 这 样 的 程序 运行 几 天 也 不 
一 定 能 产生 一 个 合法 的 数 独 ! 反 过 来 想 一 下 ， 我 们 可 以 先生 成 一 个 完整 而 
合法 的 解 ， 然 后 再 随机 去 掉 一 些 格子 中 的 数字 ， 这 样 比较 可 行 。 
[解法 一 】 

假设 ， 我 们 使 用 下 面 的 结构 来 存储 数 独 游戏 : 


int m size = 9; 
Cell[,] m cells; 


下 面 的 GenarateValidMatrix() 遂 数 用 经 典 的 深度 优先 搜索 来 生成 一 个 可 
行 解 。 我 们 从 (0，0) 开始 ， 对 于 没有 处 理 过 的 格子 ， 首 先 调用 
GetValidValueList(coCurrent) 来 获得 当前 格子 可 能 的 取 值 选择 ， 并 从 中 取 一 
个 为 当前 格子 的 取 值 ， 接 着 搜索 下 一 个 格子 。 在 搜索 过 程 中 ， 若 出 现 某 个 
格子 没有 可 行 的 取 值 ， 则 回溯 ， 修 改 前 一 个 格子 的 取 值 。 直 到 所 有 的 格子 
都 找到 可 行 的 取 值 为止 ， 这 个 时 候 我 们 就 找到 了 一 个 可 行 解 。 
代码 清单 1-23 


扬 n @ 1 ni 
ArraybLis EE 
(+0CsISP ) 
al = GetVal aluel t (coCcurrent); 
Cc.ValidLis al; 
£f( alidI unt 0) 
.PickNextValidValue(); 
f (coCurrent .x this 12z - gk 
irrent = thi su" 
break We ch the end of the mat 
| 
els keep going the n 
[ 
coCurrent extCoord(coCurrent) 
:13 
// if we reach the beginning, break out 
et ent = 0 && CoCurrent.y == 0) 
| 
Dr 3 
els 
lear (); 
rrent eVC rdil(c urrent); 
ret 1 trues; 


一 个 可 行 解 生成 之 后 ， 我 们 可 以 随机 删 去 一 些 格子 中 的 数值 。 我 们 删 
除 的 数字 越 少 ， 游 戏 就 越 简单 ;删除 的 数字 越 多 ， 游 戏 就 越 难 ， 而 且 可 能 
有 多 种 解法 ， 但 是 这 也 没有 什么 关系 
是 根据 用 户 填 写 的 数字 是 否 等 于 我 们 原来 生成 的 数据 ， 而 是 根据 : 


(a) 所 有 的 格子 都 填 完 ; 


我 们 判断 一 个 游戏 是 否 结 


(b) 所 有 的 行 、 列 、 小 矩阵 都 符合 条 件 。 
【解法 二 】 

上 面 提 到 的 解法 虽然 经 典 ， 但 是 并 不 是 唯一 的 正解 ， 还 有 许多 别 的 解 
法 。 例 如 ， 假 设 已 经 有 一 个 3x3 的 矩阵 是 排列 好 了 的 ， 具 体 数 字 姑 且 用 字母 


代替 ， 如 图 1-20 所 示 : 
| 亡 | ec 
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图 1-20 


把 整个 数 独 和 矩阵 的 各 个 小 矩阵 分 别 命名 为 Bl! ，B, ，...，Bo ， 如 图 1-21 


所 示 : 
画 醒 本国 喇 三 本 硬 副 
忌 | | 机 | 本 
ET 


那么 ， 可 以 把 这 个 矩阵 放 在 数 独 的 中 央 (Bs ) 的 位 置 上 ， 然 后 看 看 有 
没有 一 种 办 法 能 “生成 ”其 他 格子 内 的 合法 排列 ， 如 图 1-22 所 示 : 


图 1-22 
第 一 步 ， 先 通过 置换 行 的 办 法 ， 把 B, 和 Be 矩阵 填 好 ， 可 以 看 出 abc 这 


一 行 被 移 到 了 另外 两 个 矩阵 中 不 相同 的 行 上 。def、ghi 这 两 行 也 一 样 ， 如 图 
1-23 所 示 。 
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第 二 步 ， 对 中 央 小 矩阵 的 每 一 列 做 同样 的 变换 ， 把 B, 和 Bs 都 解决 了 ， 
如 图 1-24 所 示 。 
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第 三 步 ， 对 4 个 角 上 的 小 矩阵， 能 通过 对 其 相 邻 矩阵 进行 类 似 置 换 得 到 
么 ? 试 试看 ， 通 过 列 置换 的 方式 ， 用 Bi 生成 B; 和 B; ， 用 Be 生成 B3 和 Bo ， 


如 图 1-25 所 示 。 
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看 起 来 这 整个 数 独 和 矩阵 是 合乎 规定 的 ! 

这 么 说 ， 可 以 用 {(1，2，3，4，5，6，7，8，9} 随 机 映射 到 {a，b，c， 
d，e，f，g，h， 计 上 ， 这 样 会 生成 9! 个 不 同 的 数 独 。 需 要 说 明 的 是 ， 这 并 
不 包括 所 有 合法 的 数 独 ， 差 得 很 远 2?。 但 是 对 于 一 般 玩 数 独 的 游戏 爱好 者 来 


说 ， 已 经 足够 他 们 玩 一 阵 的 了 。 还 可 以 通过 部 分 行 或 列 的 局 部 对 换 来 增加 
变化 的 数目 。 这 种 办 法 的 优点 是 程序 非常 简单 ， 简 单 到 不 值得 印 在 纸 上 。 


扩展 问题 


在 应 用 程序 中 ， 有 很 多 大 大 小 小 的 窗口 按钮 控件。 我 们 经 常 要 判 
断 鼠 标点 击 的 位 置 是 不 是 在 某 一 个 窗口 一 按钮 二 控件 上 ， 或 者 某 个 控件 跟 
某 个 窗口 的 关系 〈 该 控件 是 否 在 窗口 中 ， 是 否 跟 窗 口 相 交 等 ) 。 而 这 些 窗 
口 一 按钮 一 控件 ， 可 以 把 它们 抽象 为 一 个 跟 屏 幕 的 长 宽 平 行 的 大 小 不 同 的 
和 矩形。 为 了 方便 地 完成 上 面 这 些 经 常 性 的 操作 ， 应 该 如 何 表示 这 些 窗口 ? 

附 : 下 面 是 笔者 用 程序 生成 的 几 个 数 独 游 戏 ， 难 度 由 浅 入 深 ， 读 者 不 
妨 一 试 : 


二 
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1.16 ”24 点 游戏 


24 点 是 一 种 老少 咸 宜 的 游戏 ， 它 的 具体 玩法 如 下 : 

给 玩家 4 张 牌 ， 每 张 牌 的 面值 在 1 一 13 之 间 ， 人 允许 其 中 有 数值 相同 的 
牌 。 采 用 加 、 减 、 乘 、 除 四 则 运算 ， 人 允许 中 间 运 算 存 在 小 数 ， 并 且 可 以 使 
用 括号 ， 但 每 张 牌 只 能 使 用 一 次 ， 尝 试 构造 一 个 多 项 式 ， 使 其 运算 结果 为 
24。 

请 你 根据 上 述 游戏 规则 构造 一 个 玩 24 点 游戏 的 算法 ， 要 求 如 下 : 

输入 ?hy hy is 

输出 : 若 能 得 到 运算 结果 为 24， 则 输出 一 个 对 应 的 运算 表达 式 。 

如 : 

输入 : 11，8，3，5 

输出 : (11 一 8) x (3 十 5) 一 24 
分 析 与 解法 

【解法 一 】 

最 直接 的 想法 就 是 采用 穷 举 法 ， 因 为 运算 符号 只 有 4 种 ， 每 个 数字 只 能 
使 用 一 次 ， 所 以 通过 穷 举 4 个 数 所 有 可 能 的 表达 式 ， 并 分 别 计 算出 各 表达 式 
的 值 ， 就 可 以 得 到 答案 。 那 么 如 何 穷 举 所 有 可 能 的 表达 式 呢 ? 

先 不 考虑 使 用 括号 ， 可 以 做 出 如 下 分 析 : 

因为 每 个 数 只 能 使 用 一 次 ， 那 么 就 对 4 个 数 进行 全 排列 ， 总 共有 41! = 
4x3x2x1 王 24 种 排列 。4 个 数 的 四 则 运算 中 总 共 需 要 3 个 运算 符 ， 同 一 运算 符 
可 以 重复 出 现 ， 那 么 对 于 每 一 个 排列 ， 总 共 可 有 4x4x4 种 表达 式 。 因 此 在 不 
考虑 括号 的 情况 下 ， 总 共 可 以 得 到 4! x43 = 二 1536 种 表达 式 。 

接 下 来 再 考虑 加 上 括号 后 的 情况 ， 对 于 4 个 数 而 言 ， 总 共 会 有 以 下 5 种 
加 括号 的 方式 : (A (B (CD) ) 、 (A ( (BC) D) 、( (AB) 

(CD) ) 、((A (BC) ) D) 、(( (AB) C) D) 。 

所 以 需要 遍历 的 表达 式 数 最 多 有 4! x43 x5 二 7680 种 。 当 然 ， 这 里 可 以 

采用 逆 波 兰 表 达 式 的 方法 ， 但 其 表达 式 数 仍 为 4! x43 x5 二 7680 种 。 


通过 上 面 的 分 析 ， 得 到 了 一 种 解 24 点 的 基本 思路 ， 即 遍历 运算 符 、 数 
字 和 括号 的 所 有 排列 组 合 形式 ， 接 下 来 ， 我 们 将 更 加 细致 地 讨论 这 种 解法 
的 一 个 具体 实现 。 

假设 给 定 的 4 个 数组 成 的 集合 为 A 二 {1，2，3，4}， 定 义 阅 数 f (A) 为 
对 集合 A 中 的 元 素 进 行 所 有 可 能 的 四 则 混合 运算 所 得 到 的 值 。 

首先 从 集合 A 中 任意 取出 两 个 数 ， 如 取出 1 和 2，A 二 A 一 {1，2}， 对 取 
出 来 的 数 分 别 进行 不 同 的 四 则 运算 ，1 十 2 和 3，1 一 2 三 -1，1/2 三 0.5，1x2 一 
2， 将 所 得 的 结果 再 分 别 加 入 集合 A， 可 得 到 B 三 {3，3，4}，C={-1，3， 
4}, DD 二 {0.5，3，4}, EE 二 {2，3，4} 四 个 新 的 集合 ， 那 么 f (A) =f (B) 
十 f (C) 十 f(D) 十 f (E) ， 通 过 以 上 的 计算 就 达到 了 分 而 治之 的 目的 ， 
问题 规模 就 从 4 个 数 降 到 了 3 个 数 ， 成 了 3 个 数 的 4 个 子 问 题 之 和 。 

综 上 所 述 ， 可 以 得 到 递归 解法 为 : 

首先 将 给 定 的 4 个 数 放 入 数组 Array 中 ， 将 其 作为 参数 传 入 国 数 f 中 ， 伪 
代码 如 下 : 
代码 清单 1-24 


f (Array) 
if (Array.Length < 2) 


if ( 得 到 的 最 终结 果 为 : 4) 输出 表达 式 
:lse 输出 无 法 构造 符合 要 求 的 表达 式 
foreach (从 数组 中 任 取 两 个 数 的 组 合 ) 
ch (运算 符 (十 ,一 ，X，/) ) 


1 .计算 该 组 合 在 此 运算 符 下 的 结果 
2。 将 该 组 合 中 的 两 个 数 从 原 数 组 中 移 除 ， 并 将 步骤 1 的 计算 结果 放 入 数组 
。 对 新 数组 递归 调用 E。 如 果 找 到 一 个 表达 式 则 返回 
4 ， 将 步骤 1 的 计算 结果 移 除 ， 并 将 该 组 合 中 的 两 个 数 重 新 放 回 数组 中 对 应 的 位 置 


| 


具体 代码 如 下 : 
代码 清单 1-25 


const double Threshold = 1E-6; 
const int CardsNumber = 4; 
const int ResultValue = 24; 
double number[CardsNumber]; 
string result[CardsNumber]; 


bool PointsGame (int n) 
{ 
if(n == 1) 
{ 
// 由 于 浮 点 数 运算 会 有 精度 误差 ， 所 以 用 一 个 很 小 的 数 1E- 6 来 做 容 差 值 
// 本 书 中 2 .6 节 中 讨论 了 如 何 将 浮 点 数 转化 为 小 数 的 问题 
if(fabs (number[0] ~ ResultValue) < Threshold) 
{ 
cout << result[0] << endl; 
return true; 
} 
else 
{ 
return false; 
} 


} 


for (Ln 和 二 07 二 二 入 二 TY 
{ 
于 
{ 
double a, b; 
string expa, expb; 


a 三 number [1]; 
b = number[i1]; 
numberf1j] = nvmber[n ~ 1); 


expa = zesult[z]， 
expb = result[j]; 
result[j] = zesult[n - 1); 


result[i] = '"(' + expa + '+' + expb + ')'; 
number[i] = a + b; 
if{PointsGame(n - 1)) 

return true? 


result[{i] = '(' + expa + '-' + expb + ')'} 
numberfi] = 五 = b; 
42({(BPozncsGame 人 (Rn - 1)) 

return true; 
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result[i] = '(' + expa + '/' + expb + ')'; 
number[i] = a “小 
if (FointsGame (n 一 1)) 

return true;? 
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for{int i = 0; i < CardsNumber; i++) 
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这 种 解法 的 思路 比较 清晰 ， 但 仍然 是 一 种 穷 举 算法 ， 存 在 不 少见 余 计 
算 ， 比 如 没有 考虑 到 加 法 和 乘法 的 交换 率 等 ， 而 且 复杂 度 也 没有 降低 。 


可 以 对 算法 一 的 穷 举 算 法 进行 简单 的 改进 ， 如 在 满足 交换 律 的 加 法 和 
乘法 运算 中 ， 我 们 规定 ， 第 一 操作 数 必须 小 于 第 二 操作 数 ， 就 是 说 ， 如 果 A 
>B， 那 么 只 进行 B 十 A 的 计算 ， 若 遇 到 A 十 B 的 计算 时 则 简单 地 返回 。 其 实 
这 是 一 种 简单 的 剪 枝 策 略 ， 通 过 将 某 些 匈 余 (或 者 达 不 到 最 优 解 ) 的 穷 举 
路 径 剪 掉 ， 达 到 一 个 较 好 的 运算 策略 。 

【解法 二 】 

解法 一 中 存在 着 大 量 的 见 余 计算 ， 是否 能 够 将 这 些 见 余 计算 降低 到 最 
低 呢 ? 在 解法 二 中 我 们 将 从 另 一 个 角度 来 思考 该 题 。 

仍然 定义 要 计算 的 初始 数据 (题目 中 4 张 牌 的 数值 ) 都 放 于 集合 A 中 

(集合 A 为 多 重 集合 ， 因 为 允许 出 的 牌 中 有 重复 面值 ) ， 定 义 函 数 f (A) 为 
对 集合 A 中 的 元 素 进行 所 有 可 能 的 四 则 混合 运算 所 得 到 的 值 。 可 以 采用 分 冶 
的 思想 ， 先 将 A 划 分 为 两 个 子 集 Aj 和 A 一 A| ， 其 中 Ai 为 A 的 非 空 真子 集 

( 若 Ai 为 空 集 或 全 集 ， 则 转换 成 了 原 问题 ) ， 分 别 计算 A; 和 A 一 Ai 中 的 元 
素 进 行 四 则 混合 运算 所 能 得 到 的 结果 集合 ， 即 f (Ai ) 和 f (A 一 Ai ) ， 然 
后 对 f (Ai; ) 和 f (A 一 Ai ) 这 两 个 集合 中 的 元 素 进行 加 减 乘除 运算 ， 最 后 
得 到 的 所 有 集合 的 并 集 就 是 f (A) 。 

给 定 两 个 多 重 集合 A 和 B (同上 ， 因 为 允许 出 的 牌 中 有 重复 的 面值 ) ， 
定义 两 个 集合 中 的 元 素 运 算 如 下 : 

Fork (A,B)=U {a+b, a-b, b-a, axb, a:b(b#0), b+:a (a*0)} ---- 定 义 1-16-1 

其 中 (a，b) EAxB,“x” 为 集合 的 叉 乘 ， 即 aEA, bEB， (a，b) 为 
集合 A 和 B 中 可 能 的 两 两 组 合 ， 假 设 集合 Ai; 中 有 n 个 元 素 ， 集 合 A, 中 有 m 个 
元 素 ， 那 么 将 有 nxm 个 (a，b) ， 而 每 对 值 需 要 分 别 进 行 6 个 计算 〈 见 Fork 
定义 ) ， 既 Fork (A; ，A, ) 的 结果 集中 将 有 6xnxm 个 元 素 。U 为 集合 的 并 
运算 。 

Fork (A，B) 实际 上 定义 了 两 个 集合 中 的 元 素 两 两 进行 加 减 乘 除 运算 
所 能 得 到 的 全 部 结果 集合 ， 所 以 在 计算 Fork (A，B) 的 过 程 中 ， 可 以 将 重 
复出 现 的 结果 去 掉 ， 也 就 是 说 Fork (A，B) 返回 的 结果 集 不 再 是 多 重 集 ， 
而 只 是 一 个 简单 的 集合 了 。 通 过 去 除 重复 出 现 的 中 间 结 果 ， 也 就 是 通过 剪 
枝 ， 可 以 在 一 定 程度 上 提高 效率 。 注 意 ， 这 与 Fork (A，B) 允许 A 和 B 为 多 
重 集 并 不 矛盾 。 


那么 对 于 有 理 数 组 成 的 多 重 集合 A (中 间 结 果 可 能 不 再 是 整数 ) ， 如 果 
A 至 少 有 两 个 元 素 ， 则 f (A) 二 UFork (f (A1) ，f (A 一 Ai ) ) ， 其 中 A) 
取 遍 A 的 所 有 非 空 真子 集 〈 若 Ai 为 空 集 或 全 集 ， 则 转换 成 了 原 问 题 ) 。 假 
设 集合 A 中 有 n 个 元 素 ， 那 么 集合 A 的 所 有 非 空 真子 集 个 数 为 2n 一 2 ( 减 掉 空 
集 和 全 集 ) ， 即 f (A) 的 第 一 层 递 推 式 中 共有 (2n 一 2) /2 个 Fork 函 数 (将 
所 有 的 真子 集 按照 原 集合 的 划分 两 两 配对 ) 。 

通过 以 上 的 分 析 ， 得 到 了 另 一 种 计算 f(A) 的 方法 。 根 据 f (A) 的 定 
义 式 ， 可 以 简单 地 直接 递归 计算 f (A) ， 但 那样 会 有 很 多 宛 余 计算 。 

例如 对 于 A 二 {1，2，3，4}， 如 图 1-26 所 示 : 


f(1,2,3,4) 
f(1)  f(2,3,4) fl2)  f(1,3,4) ‘(1,2) WE 
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图 1-26 ”对 F 函 数 分 解 示意 图 


图 1-26 是 个 树 状 结 构 (图 中 并 未 详细 列 出 所 有 的 情况 ) ， 树 的 每 个 节点 
是 一 个 集合 ， 每 个 节点 都 为 其 子 节点 的 并 集 。 其 中 ， 椭 圆 形 的 节点 代表 其 
中 的 两 个 集合 需要 进行 Fork() 计 算 。 

计算 到 最 后 ， 根 节点 中 将 保存 f (A) =f ({1，2，3，4}) 的 结果 。 

其 中 的 计算 匈 余 可 举例 如 下 : 
CA EOPKO CR Ty A A EO CR oD EC dD 

计算 f (A) 的 时 候 需要 计算 f ({2, 3, 4}) 、f (1, 3, 4) 和 f ({3， 
4}) ， 又 因为 


f ({2, 3, 4}) = Fork (f ({2} 
EC G7 43 sme EOrk GE Gt} CS 人 二 


在 计算 f ({2，3，4}) 和 f ({1，3，4}) 的 时 候 又 要 重复 地 计算 f 
({3，4}) ， 这 就 产生 了 宛 余 的 计算 ， 如 图 1-26 中 加 了 阴影 的 部 分 所 示 。 针 


对 宛 余 计算 的 部 分 ， 可 以 将 已 求解 过 的 子 问题 (如 上 面 的 f ({3，4}) ) 记 
录 在 一 张 表 中 ， 当 再 次 需要 求解 该 子 问题 时 ， 即 可 直接 从 表 中 查询 出 该 子 
问题 的 解 。 这 种 解决 元 余 的 算法 设计 策略 ， 其 实 包 含 了 动态 规划 的 思想 。 
解法 二 从 集合 划分 和 合并 (Fork 运 算 ) 的 角度 ， 对 24 点 游戏 进行 解 
4 
在 实际 实现 的 时 候 ， 我 们 可 以 用 二 进 制 数 来 表示 集合 和 子 集 的 概念 ， 
由 于 24 点 游戏 的 输入 集合 A 中 只 有 四 个 元 素 〈 设 A={au ，al ，a ，as }) ， 
可 以 采用 4 位 的 二 进 制 数 来 表示 集合 A 及 其 真子 集 ， 当 且 仅 当 a (0<=i< 
二 3) 在 某 一 个 真子 集中 时 ， 该 真子 集 所 代表 的 二 进 制 数 对 应 的 第 i 位 〈 从 左 
到 右 ) 才 为 1， 否 则 为 0。 如 Ai ={fal ，ao ，as }， 则 1110 代 表 Ai ， 若 A, = 
{ao ，as3 }， 则 0101 代 表 A, 。 故 A 的 所 有 真子 集 的 范围 从 1 到 2n 一 2 (n= 
4) ， 即 1 到 14。 再 用 一 个 大 小 为 2n 一 1 (n= 二 4) 数组 s 来 保存 f (i) (1<=i 
<=15) ， 数 组 $ 的 每 一 个 元 素 S[i] 都 是 一 个 集合 (f  ) ， 其 中 S[2n 一 1] 
即 为 集合 A 中 的 所 有 元 素 通 过 四 元 运算 和 加 括号 所 能 得 到 的 全 部 结果 ， 通 过 
令 查 S[2n 一 1]， 即 可 得 知 某 个 输入 是 否 有 解 。 伪 代码 如 下 : 
代码 清单 1-26 


iGame (Array) // Array 为 初始 输入 的 集合 , 其 中 元 素 表 示 为 ai (0<=i<=n-1) 
forl(int i A "| 
] = 中 :; 初始 化 将 S 中 各 个 集合 置 为 空 集 , n 为 集合 Array 的 元 素 个 数 ， 
在 24 点 中 即 为 4， 后 面 出 现 的 n 具 相同 含义 
r (int ) 
S [27] {ail}; 先 对 每 个 只 有 一 个 元 素 的 真子 集 赋 值 ， 即 为 该 元 素 本 身 
for(int i 9 i 28 一 下 7 于] 每 个 i 都 代表 着 Array 的 一 个 真子 集 
heck (S[2° - 1]); / 检查 S12”1] 中 基 否 有 值 为 24 的 元 类， 并 返回 


代码 清单 1-27 


f (int i) i 的 二 进 制 表 示 可 代表 集合 的 一 个 真子 集 ， 具 体 含义 见 上 面 的 分 析 


if (S[i] 关 QD) 
return S[i]; 
for (int x 1; x < ii i++) // 具有 小 于 的 x 才 可 能 成 为 i 的 真子 集 
有 5 为 与 运算 ， 只 有 当 xs&8i==x 成 立时 x 才 为 的 子 集 ， 此 时 -x 为 i 的 
男 一 个 真子 集 ，x 与 -x 共同 构成 羡 的 一 个 划分 ， 读 者 可 自行 验 记 
[il UU= Fork(f(i), f(i-x)); U 为 集合 的 并 运算 ，Fork 见 定义 1-16-1， 
在 Fork 的 过 程 中 ， 去 除 重复 中 间 结 果 …* 


总 结 

解法 一 和 解法 二 分 别 从 不 同 的 角度 对 24 点 游戏 进行 了 解答 ， 它 们 都 很 
容易 扩展 到 n 张 牌 之 和 为 m 的 游戏 。 若 需要 实现 一 个 完整 的 游戏 时 ， 可 预先 
将 所 有 可 能 的 输入 都 进行 求解 ， 并 将 输入 和 解 按 照 某 种 数据 结构 进行 组 织 
(如 hash 等 ) ， 这 样 在 初始 化 结束 之 后 ， 便 可 在 O (1) 的 时 间 内 对 所 有 的 
输入 返回 其 答案 。 
扩展 问题 

1. 试 试 下 面 几 个 测试 用 例 ， 看 看 你 写 的 解法 能 不 能 算出 正确 的 表达 式 
来 : 

5, 5, 5, 1 

3 

ee 

4，4，10，10 

1，4，5，6 

3，8，8，10 

4，4，10，10 

9，9，6，2 

2. 大 家 不 妨 考虑 一 下 ， 如 果 要 优化 上 述 算 法 ， 可 以 从 哪 几 个 方面 入 
手 ? 

3. 若 给 n 张 牌 ， 要 求 最 后 结果 为 m， 又 该 如 何 解 呢 ? (提示 ， 其 实 本 题 
中 的 两 种 解法 已 经 都 能 够 求解 该 问题 了 。 ) 

4. 如 果 我 们 把 阶乘 (! ) 作为 一 个 合法 的 运算 符 (当然 只 对 正 整 数 适 
用 ) ， 上 面 的 程序 要 怎么 改进 ? (提示 : 在 本 题 的 两 种 解法 的 基础 上 ， 人 很 


容易 能 够 运算 扩展 到 阶乘 〈! ) (只 针对 正 整数 ) ， 但 要 注意 阶乘 (! ) 
只 是 一 元 运算 符 。 ) 

附 : 扩展 问题 1 的 解答 : 

5x (5 一 15) 三 24 

7x (3 十 3/7) =24 

8/ (3 一 8/3) 三 24 

4/ (1 一 5/6) 三 24 

(8x10 一 8) /3 三 24 

(10x10 一 4) /4 三 24 

9x (2 十 6/9) 三 24 


~ 


1.17 俄罗斯 方块 游戏 


俄罗斯 方块 (英文 : Tetris) 是 从 20 世 纪 80 年 代 开始 风靡 全 世界 的 电脑 
游戏 。 俄 罗斯 方块 是 由 下 面 这 几 种 形状 的 积木 块 构成 ， 如 图 1-27 所 示 : 


mm de on Md 他 


图 1-27 


如 果 你 说 你 没 玩 过 Tetris 游 戏 ， 面 试 者 一 定 会 比较 惊讶 ， 不 过 面试 者 还 
是 会 耐心 地 跟 你 解释 它 的 游戏 规则 : 

”积木 块 会 从 游戏 区 域 上 方 开 始 缓 慢 落 下 。 

”玩家 可 以 做 的 操作 有 : 90 度 旋转 积木 块 ， 左 右 移 动 积木 块 ， 或 者 让 
积木 块 加 速 落下 。 

”积木 块 移 到 游戏 区 域 最 下 方 或 是 落 到 其 他 积木 块 上 无 法 移动 时 ， 就 
会 固定 在 该 处 ， 而 之 后 新 的 积木 块 就 会 出 现在 区 域 上 方 开 始 落 下 。 

四” 当 游戏 区 域 中 某 一 行 格子 全 部 由 积木 块 填 满 ， 则 该 行 会 消失 并 成 为 
玩家 的 得 分 。 一 次 删除 的 行 数 越 多 ， 得 分 越 多 。 

中” 当 积木 块 堆 到 区 域 最 上 方 ， 则 游戏 结束 。 

好 ， 现 在 的 问题 是 : 

1. 如 果 你 是 设计 者 ， 如 何 设 计 各 种 数据 结构 来 表示 这 个 游戏 的 各 种 元 
素 ， 如 每 一 个 可 活动 的 积木 块 、 在 底层 堆积 的 积木 等 。 

2. 现在 已 经 知道 底层 积木 的 状态 ， 然 后 在 游戏 区 域 上 方 出 现 了 一 个 新 
的 积木 块 ， 你 如 何 运 用 刚才 设计 的 数据 结构 来 判断 新 的 积木 块 要 如 何 移 位 
或 旋转 ， 才 能 最 有 效率 地 消除 底部 累积 的 积木 ? 

3. 有 些 版 本 的 Tetris 游 戏 有 一 个 预览 窗口 ， 从 预览 窗口 可 以 看 到 下 一 个 
积木 块 是 什么 形状 。 玩 家 这 时 候 就 可 以 提前 计划 ， 比 如 ， 如 果 下 一 个 积 
块 是 一 根 长 条 ， 我 们 就 不 要 把 最 深 的 “峡谷 ” 堵 住 。 那 么 我 们 有 了 这 个 新 的 
参数 ， 如 何 改写 上 一 个 程序 ， 才 能 最 有 效率 地 消除 底部 累积 的 积木 ? 


分 析 与 解法 


俄罗斯 方块 的 确 是 非常 经 典 的 游戏 ， 网 络 上 常常 出 现 高 手 的 游戏 视 
频 ， 他 们 的 表现 让 人 叹为观止 。 如 果 你 是 一 个 俄罗斯 方块 高 手 ， 那 你 几乎 
不 用 思考 ， 让 直觉 指导 自己 下 一 步 怎 么 操作 。 电 脑 没 有 直觉 ， 它 只 能 当 一 
个 初学 者 ， 所 以 我 们 必须 为 它 找 到 一 种 可 操作 的 流程 。 

每 一 块 积木 块 落下 的 过 程 中 ， 我 们 可 以 做 : 

四 “旋转 到 合适 的 方向 

四 “水平 移动 到 某 一 列 

昌 垂直 下 落 到 底部 

对 于 高 手 来 说 ， 下 落 的 过 程 中 还 可 以 有 更 多 精彩 的 表现 ， 比 如 平移 方 
块 “ 钻 ” 进 洞 里 去 (如 图 1-28 所 示 ) 。 我 们 暂时 不 考虑 这 种 特殊 情况 。 


图 1-28 


现在 可 以 考虑 用 怎样 的 数据 结构 来 模拟 积木 块 下 落 的 过 程 。 

首先 ， 用 一 个 二 维 数 组 area[M][N] 表 示 M*N 的 游戏 区 域 。 其 中 ， 数 组 中 
值 为 0 表示 空 ，1 表 示 有 方块 。 

积木 块 也 用 数组 来 表示 ， 但 是 各 种 积木 块 的 尺寸 都 不 相同 (如 长 条 是 
1x4 的 ， 方 块 是 2x2 的 ) ， 而 且 旋转 后 的 尺寸 也 可 能 发 生变 化 ， 如 果 为 不 同 
的 积木 块 设计 不 同 尺 寸 的 数组 ， 则 可 能 造成 程序 管理 的 混乱 。 因 此 我 们 需 


要 用 统一 尺寸 的 数组 来 容纳 所 有 可 能 的 积木 块 ，4x4 的 数组 (图 1-29 表 示 了 
五 种 积木 ) 可 以 满足 要 求 。 


图 1-29 


积木 块 一 共有 7 种 ， 每 种 积木 块 有 4 种 方向 。 综 上 所 述 ， 定 义 
BlockSets[7][4][4][4] ， 表 示 7 种 积木 块 的 4 个 旋转 方向 的 形状 。 我 们 在 编译 前 
将 这 个 数组 的 值 预计 算 好 ， 在 程序 中 即 可 直接 使 用 。 

读者 一 定 会 发 现 有 些 积 木 块 实际 上 只 有 两 种 旋转 方式 ， 为 了 减少 程序 
中 的 判断 条 件 ， 我 们 依然 采用 适当 浪费 内 存 的 方法 。 

使 用 上 面 的 数据 结构 ， 能 够 很 方便 地 得 到 方块 旋转 后 的 形状 
rotatedBlock 二 BlockSets[n][m%4， 其 中 n 是 特定 的 方块 序号 ，m 是 旋转 的 次 
数 。 

接 下 来 的 问题 是 判断 方块 的 水 平移 动 范 围 ， 我 们 记录 积木 块 左上 角 相 
对 于 游戏 区 域 的 位 移 为 (offset X，offset Y) ,平移 范围 即 为 Offset X 的 取 
值 范 围 。 

由 于 积木 块 可 能 无 法 占 满 4x4 区 域 的 每 一 列 ， 因 此 横向 位 移 x 的 值 可 能 
小 于 0。 首 先 计算 积木 块 所 占 区 域 的 最 小 列 minCol 和 最 大 列 maxCol， 则 
Offset Xx 的 取 值 范围 为 [0 一 minCol，M 一 1 一 maxCol]。 图 1-30 中 ,LL 型 积木 块 
占据 的 最 小 列 和 最 大 列 分 别 为 1 和 2。 因 此 ， 这 个 积木 块 在 游戏 区 域 里 面 水 
平移 动 的 范围 为 [-1，N 一 3]。 


maxCol=2 
aX 


minRow=1 一 ”> 


maxRow=3 一 亿 


minCol=1 
min 


图 1-30 


有 了 位 移 坐 标 ， 就 很 容易 计算 出 积木 块 是 否 和 游戏 区 域 中 已 有 的 方块 
重 又 。 与 minCol 和 maxCol 一 样 ， 定 义 minRow 和 maxRow 为 积木 块 所 占 区 域 
的 最 小 行 和 最 大 行 。 因 此 下 落 过 程 可 以 表示 为 : 
代码 清单 1-28 


While (OffsetY < N - maxRow) 
OffsetY++ 
Flag = 0 
For i = 0 To 3 // 判 断 是 否 和 已 有 方块 重合 
For j] 一 0To 3 
If (Block[il[jJ]j <> 0 And Areal[lOffsetX + i] [OffsetY + 3] <> 0) Then 
Flag = 1 
End If 
Next 
Next 
If (Flag = 1) Then Return OffsetY -~ 1 // 旭 果 有 重合 ， 则 不 能 下 落 到 该 行 
Loop 


这 是 一 个 可 行 的 算法 ， 但 是 效率 比较 低 。 因 为 每 下 落 一 行 ， 很 多 区 域 
都 需要 重复 判断 。 有 没有 更 有 效 的 方法 呢 ? 以 图 1-31 的 所 示 世 型 积木 块 为 
例 ， 希 望 其 下 落 在 Offset X 三 3 这 一 列 。 我 们 发 现 ， 可 以 下 沙 到 的 最 低 高 度 
取决 于 最 先 接触 到 已 有 方块 那 一 列 。 由 此 ， 可 以 计算 每 一 列 触 底 高 度 的 最 
小 值 ， 即 miny--3 (d; 一 maxRowi ) ， 其 中 di 是 该 列 堆 积 方 块 的 高 度 。 

在 图 1-31 中 ，L 型 积木 块 第 0 列 和 第 3 列 没 有 方块 ， 则 无 须 考虑 ; 第 1 列 
和 第 2 列 maxRow 分 别 为 3 和 1。 游 戏 区 域 第 4 列 和 第 5 列 的 最 高 高 度 分 别 为 N 和 


N 一 5。 因 此 ， 积 木 块 将 下 落 到 的 高 度 为 nin (N 一 3，N 一 5 一 1) = 二 N 一 6， 
即 L 型 积木 块 会 停留 在 位 移 (3，M 一 6) 的 位 置 。 


图 1-31 


由 此 ， 已 经 能 够 模拟 一 个 方块 的 下 落 过 程 。 通 过 枚 举 的 方法 ， 能 够 得 
到 积木 块 在 各 种 旋转 角度 下 ， 在 各 列 下 落 的 格局 。 
代码 清单 1-29 


Dim configurations AS Array 


For i = 0 To 3 // 穷 举 所 有 旋转 方向 ,得 到 各 种 种 旋转 方式 下 的 积木 块 形状 
rotatedBlock = GetRotatedBlock(CcurrentB1lock，i) 
[mincol，maxCcol]l = CalcoffsetXRange (rotatedBlock) // 计算 横向 坐标 可 以 
// 移动 的 范围 
1inCo naxt( 
y CalcBottomOffsetyYy (rotatedBlock, Jj) // 计算 下 洲 停 留 的 纵 网 位 移 
configurations.Add (i, j, y) 1/ 保存 当前 格局 
ext 


现在 离 * 自 动 摆 放 ” 的 人 工 智 能 只 有 一 步 之 遥 一 一 判断 哪 一 种 格局 更 
好 。 

世界 上 举办 过 俄罗斯 方块 人 工 智能 的 竞赛 ， 两 个 选手 分 别 使 用 自己 写 
的 智能 模块 操作 积木 块 ， 看 谁 的 程序 能 够 在 指定 时 间 内 得 到 更 多 的 分 数 。 
在 此 我 们 仅 给 出 一 种 启发 性 的 思路 ， 而 不 给 出 具体 的 解法 。 

当 你 问 一 个 俄罗斯 方块 玩家 怎样 摆 放 算是 好 的 ， 他 一 般 会 建议 : 一 次 
性 多 消 行 ， 不 要 形成 * 洞 ”( 图 1-32 中 和 斜 线 部 分 ) ， 争 取 不 要 摆 放 太 高 。 作 为 
一 个 自然 人 ， 你 能 够 理解 他 的 意思 。 但 是 ， 计 算 机 对 这 种 感性 的 语言 没有 


梧 百 和 冯 


理解 能 力 ， 没 办 法 要 求 它 用 感性 的 方法 回答 哪 种 摆 放 比较 好 ， 因 此 需要 将 
格局 的 好 坏 用 一 种 量化 的 方法 表示 出 来 。 

我 们 采用 * 计 分 制 ”， 有 具体 来 讲 就 是 如 果 这 种 摆 放 达到 了 某 要 求 就 增加 
某 一 指定 的 分 数 ， 反 之 扣除 。 举 例 来 说 ， 如 果 这 种 摆 放 可 以 消除 2 行 ， 则 加 
上 3 分 ; 如果 形成 了 5 个 “ 洞 * 则 扣除 20 分 。 


图 1-32 


高 手 的 建议 可 以 用 如 下 的 计 分 方法 量化 : 

四 ”一 次 性 多 消 行 : 同时 消除 1，2，3，4 行 ， 分 别 加 1，3，7，13 分 
(分 数 指数 上 升 ) ; 

上 “不 要 形成 * 洞 ”: 每 增加 1 个 洞 ， 扣 除 4 分 ， 超 过 5 个 洞 ， 额 外 扣除 15 
分 ; 

上 ”争取 不 要 摆 放 太 高 : 放置 行 高 于 M*3/5， 则 每 高 1 行 则 扣除 2 分 。 

上 述 的 分 数 是 自己 估计 的 ， 读 者 可 以 根据 实际 情况 来 调整 ， 达 到 一 个 
最 佳 智能 状况 。 下 面 是 实现 上 述 计 分 规则 的 伪 代 码 : 
代码 清单 1-30 


-OpyTo (area, tempArea) / 复制 一 份 游戏 区 域 


teTo (block, tempArea) / 和 将 积木 块 放 入 复制 的 游戏 区 域 中 
UP 
= offsetY To offsetY + 4 / 消 行 一 定 发 生 在 放 入 积木 块 的 4 行 
(RowIsFull ( p y)) T 
lineCount++; / 统计 消 行 数 
T 外， 
行 加 | 
i 在 统计 洞 数 时 需要 先 消 行 
TIE 
iole 
Or 


OffsetX TT ffsetX + 4 / 增加 的 洞 


定 出 现在 放 入 积木 块 的 4 列 
oleCount += CalcHoles (tempArea, xX) - lcHolt gp 


s (area, *) 


core -= holeCount * 4 / 每 个 洞 扣除 4 分 

f (holeCount > 5) Then Score -= 15 / 超过 5 个 湘 额外 扣除 15 分 

2 M ) I 过 高 则 提 区 域 上 方 为 
= , 


Return Score; 


先 使 用 这 个 方法 为 每 种 不 同 格局 打 一 个 分 数 ， 然 后 取 分 数 最 高 的 格局 
作为 放置 积木 块 的 位 置 。 

当然 ， 实 际 的 计 分 规则 应 该 更 复杂 ， 比 如 尽量 保留 某 一 列 为 空 ， 等 长 
条 来 时 消 4 行 ; 或者， 统计 各 种 不 同 积 木 块 出 现 的 数量 ， 预 测 后 面 可 能 出 现 
何 种 积木 块 的 概率 比较 大 ， 等 等 。 读 者 可 以 充分 发 挥 自己 的 想象 力 来 创造 
更 好 的 计 分 规则 。 

如 果 我 们 可 以 预知 下 一 块 的 形状 ， 这 个 问题 就 稍微 复杂 了 一 些 。 好 在 
俄罗斯 方块 的 游戏 区 域 并 不 大 ， 还 是 能 够 穷 举 各 种 不 同 的 摆 放 ， 然 后 同样 
使 用 * 计 分 制 ?将 最 好 的 格局 选择 出 来 。 要 注意 ， 摆 放 第 二 块 积木 前 ， 第 一 
块 积木 可 能 会 消 行 ， 因 此 需要 额外 的 空间 来 处 理 。 

更 进一步 ， 如 果 预 知 下 面 多 块 的 形状 ， 穷 举 的 方法 依然 适用 ， 但 是 复 
杂 度 呈 指 数 级 别 上 升 ， 所 以 需要 用 “ 减 枝 ”的 方法 来 降低 复杂 度 。 简 单 地 
说 ， 就 是 穷 举 一 个 积木 块 的 各 种 格局 后 ， 计 算 每 种 格局 的 得 分 ， 然 后 只 
前 N 个 最 高 得 分 的 格局 进行 后 续 计 算 。 这 种 方法 是 合理 的 : 如 果 一 个 格局 本 


身 就 很 糟 ， 那 么 在 这 个 格局 的 基础 上 继续 摆 放 也 不 会 好 到 哪里 去 。 但 是 ， 
如 果 N 设 置 的 较 小 ， 则 可 能 会 漏 掉 最 优 解 。 因 此 需要 根据 实际 情况 调整 N 的 
取 值 。 
扩展 问题 : 

1. 如 果 和 希望 支持 在 下 落 过 程 中 水 平移 动 来 “ 钻 洞 ”， 那 么 程序 流程 需要 
怎么 调整 ? 

2. 如 图 1-33 所 示 ， 我 们 假设 积木 块 在 自动 下 落 过 程 中 ， 每 两 次 自动 下 
落 间 最 多 水 平移 动 三 格 ， 那 么 该 积木 块 是 无 法 到 达 区 域 最 右 侧 的 。 如 果 增 
加 了 这 个 限制 ， 程 序 流 程 需要 怎么 调整 ? 

3. 俄罗斯 方块 ， 挖 雷 等 游戏 为 什么 这 么 流行 ? 如 果 面 试 者 让 你 给 这 些 
游戏 增加 一 些 新 功能 ， 你 能 否 在 有 限 的 时 间 内 提出 想法 ， 并 且说 服 对 方 ? 


1.18 ” 挖 雷 游戏 


挖 雷 (Minesweeper) 游戏 很 受 Windows 用 户 的 喜爱 ， 它 的 游戏 规则 很 
简单 ， 盘 面 上 有 数字 标明 周围 地 雷 的 数量 ， 游 戏 者 根据 数字 提示 ， 清 除 没 
有 地 雷 的 方块 ， 标 出 盘面 上 的 所 有 地 雷 即 可 ， 如 图 1-34 所 示 。 


副 各 一 
型 到 副 
副 剧 加 
型 于 于 
加 加 疗 
到 居 辐 
当 到 到 
型 型 加 
到 加 副 
到 到 避 
到 加 送 
剧 副 副 加 
训 副 副 
到 到 这 到 
司 当 到 到 
天 避 副 


加 副 副 副 司 加 副 副 副 副 副 厨 瑟 
图 1-34 


这 样 一 个 “古老 ”的 游戏 ， 有 什么 可 以 挖掘 的 呢 ? 

问题 1: 如 果 用 户 想 为 这 个 “古老 ”的 游戏 增加 一 个 新 功能 ， 即 按 一 个 功 
能 键 ， 就 能 看 到 剩余 所 有 未 标识 的 方块 是 否 有 地 雷 的 概率 。 你 能 否 实现 这 
一 功能 ? 

问题 2: 如 果 上 一 个 问题 太 难 了 ， 可 以 让 程序 先 标 识 所 有 肯定 有 地 雷 
的 方块 。 


注释 


@ 作者 注 : 当面 试 的 同学 听 到 这 个 问题 的 时 候 ， 很 多 人 都 有 点 意外 。 我 把 我 的 笔记 本 电脑 交 
给 他 们 说 ， 这 是 开卷 考试 ， 你 可 以 上 网 查 资料 ,干什么 都 可 以 。 大 部 分 面试 者 在 电脑 上 的 第 一 个 动 
作 就 是 上 网 搜索 “CPU 控 制 50%” 这 样 的 关键 字 ， 当 然 没 有 找到 什么 直接 的 结果 。 不 过 这 本 书 出 版 以 
后 ， 情 况 可 能 就 不 一 样 了 。 

包 如果 应 聘 者 从 来 没有 琢磨 过 任务 管理 器 ， 那 还 是 不 要 在 简历 上 说 “精通 windows” 为 好 。 

@) 例如 WaitForSingleObject0。 

(4) ”可 以 通过 Sleep() 来 实现 。 

GB) ”这 一 题目 由 微软 亚洲 研究 院 工程 师 Matt Scott 提 供 ， 他 在 学 习 中 国 象棋 的 时 候 想 出 了 这 个 题 
目 ， 后 来 一 位 应 聘 者 给 出 了 比 他 的 “正解 ”简明 很 多 的 答案 ， 他 们 现在 成 了 同事 。 

@ Gates, W.and Papadimitriou，C. "Bounds for Sorting by Prefix Reversal." Discrete 
Mathematics. 27，47 人 57，1979. 据说 这 是 Bill Gates 发 表 的 唯一 学 术 论文 。 

@ 这 是 我 们 为 了 计算 的 方便 而 制定 的 价钱 ， 不 保证 8 欧元 可 以 买 到 这 样 的 书 。 

如 果 各 种 饮料 数量 都 无 限 的 话 ， 这 种 方法 是 很 简单 。 但 是 如 果 饮 料 有 个 数 限制 ， 复 杂 度 可 
能 达到 指数 级 ， 您 有 更 好 的 办 法 么 ? 

@ CS: 英文 名 称 : Half-life 或 者 Counter-Strike， 一 种 风靡 全 球 的 第 一 人 称 动作 类 枪战 游戏 。 

在 设计 中 ， 曲 线 也 可 以 用 一 组 直线 来 模拟 以 简化 模型 ， 加 快速 度 。 

中 ”关于 在 不 同 平台 上 进行 多 线程 的 通讯 的 详细 技术 细节 ， 请 参考 相应 的 SDK 和 API 说 明 。 

@ 温馨 提示 : 你 还 记得 教 我 们 XOR 运 算 的 老师 么 ? 这 门 课 一 定 比 较 枯 燥 吧 ， 如 果 当 时 能 玩 
NIM 这 个 游戏 就 好 了 。 

人 @ 蚂 ” 提 一 句 ， 这 是 一 个 不 明智 的 分 堆 办 法 ， 不 如 分 为 (6，6) ， 这 样 必 赢 无 疑 。 

究竟 有 多 少 不 一 样 的 数 独 排列 ， 请 看 “ 数 独 知 多 少 ” 一 节 。 


面试 是 双方 平等 交流 的 过 程 ， 有 时 候 分 不 清 谁 在 面试 谁 。 


这 一 章 收 集 了 一 些 好 玩 的 对 数字 以 及 数组 进行 处 理 的 题目 。 编 程 
的 过 程 实际 上 就 是 和 数字 打交道 的 过 程 。 很 多 庞大 的 应 用 ， 例 如 搜索 
引擎 查询 并 返回 搜索 结果 的 过 程 ， 就 可 以 看 作 是 对 众多 数组 和 数组 中 
大 量 的 数字 (如 : Page Rank，Page Id) 进行 计算 、 比 较 的 过 程 。 我 们 
一 方面 不 断 地 说 要 处 理 “ 海 量 数据 *»， 另 一 方面 同学 们 在 程序 课 上 定义 
数组 的 时 候 会 写 int array[10]，int array[100] 往 往 就 觉得 “ 技 止 此 耳 ”，“ 我 
掌握 了 ”! 如 果 数 组 的 元 素 个 数 是 百 万 、 千 万 级 ， 你 的 算法 还 有 效率 
么 ? 

有 些 题目 看 似 简 单 ， 但 是 我 们 在 面试 中 发 现 ， 有 很 多 应 聘 者 不 能 
正确 地 写 出 * 冒 泡 排序 ?或 “二 分 查找 ”， 所 以 还 是 要 从 简单 的 题目 出 发 。 
能 不 能 把 简单 的 问题 完 完 全 全 地 解决 ， 没 有 任何 bug? 

有 读者 会 问 

那 这 些 题目 我 都 背 好 了 ， 再 来 面试 ， 行 么 ? 

当然 行 。 比 如 “ 求 数 组 的 子 数 组 之 和 的 最 大 值 ”( 见 正文 之 “2.14” 
节 ) 这 道 题目 ， 正 确 的 解法 只 有 不 到 10 行 代码 。 你 当然 可 以 背 好 了 再 
来 面试 。 不 过 面试 者 肯定 会 问 一 些 扩展 问题 ， 像 “如 果 数 组 首尾 相连 ， 
怎么 办 ”,， “如果 要 求 数组 的 子 数组 乘积 的 最 大 值 ”等 。 不 能 举一反三 的 
同学 ， 可 能 会 比较 难过 。 你 只 有 真正 掌握 了 这 些 内 容 ， 才 能 应 付 自 
如 。 


2.1 求 二 进 制 数 中 1 的 个 数 


对 于 一 个 字 节 (8bit) 的 变量 ， 求 其 二 进 制 表示 中 “1” 的 个 数 ， 要 
求 算法 的 执行 效率 尽 可 能 地 高 。 

分 析 与 解法 

大 多 数 的 读者 都 会 有 这 样 的 反应 : 这 个 题目 也 太 简单 了 吧 ， 解 法 
似乎 也 相当 地 单一 ， 不 会 有 太 多 的 曲折 分 析 或 者 峰回路转 之 处 。 那 么 
面试 者 到 底 能 用 这 个 题目 考察 我 们 什么 呢 ? 事实 上 ， 在 编写 程序 的 过 
程 中 ， 根 据 实际 应 用 的 不 同 ， 对 存储 空间 或 效率 的 要 求 也 不 一 样 。 比 
如 在 PC 上 的 程序 编写 与 在 散 入 式 设 备 上 的 程序 编写 就 有 很 大 的 差别 。 
我 们 可 以 仔细 思索 一 下 如 何 才能 使 效率 尽 可 能 地 “高 ”。 

[解法 一 】 

可 以 举 一 个 八 位 的 二 进 制 例子 来 进行 分 析 。 对 于 二 进 制 操作 ， 我 
们 知道 ， 除 以 一 个 2， 原 来 的 数字 将 会 减少 一 个 0。 如 果 除 的 过 程 中 有 
余 ， 那 么 就 表示 当前 位 置 有 一 个 1。 

以 10100010 为 例 ; 

第 一 次 除 以 2 时 ， 商 为 1010001， 余 为 0。 

第 二 次 除 以 2 时 ， 商 为 101000， 余 为 1。 

因此 ， 可 以 考虑 利用 整 型 数据 除法 的 特点 ， 通 过 相 除 和 判断 余数 
的 值 来 进行 分 析 。 于 是 有 了 如 下 的 代码 。 
代码 清单 2-1 


We 


【解法 二 】 使 用 位 操作 

前 面 的 代码 看 起 来 比较 复杂 。 我 们 知道 ， 向 右 移 位 操作 同样 也 可 
以 达到 相 除 的 目的 。 唯 一 不 同 之 处 在 于 ， 移 位 之 后 如 何 来 判断 是 否 有 1 
存在 。 对 于 这 个 问题 ， 再 来 看 看 一 个 八 位 的 数字 : 10100001。 

在 向 右 移 位 的 过 程 中 ， 我 们 会 把 最 后 一 位 直接 丢弃 。 因 此 ， 需 要 
判断 最 后 一 位 是 否 为 1， 而 “与 ?操作 可 以 达到 目的 。 可 以 把 这 个 八 位 的 
数字 与 00000001 进 行 “ 与 ?操作 。 如 果 结 果 为 1， 则 表示 当前 八 位 数 的 最 
后 一 位 为 1， 否 则 为 0。 代 码 如 下 : 
代码 清单 2-2 


TI 


eturn num; 


【解法 三 】 

位 操作 比 除 、 余 操作 的 效率 高 了 很 多 。 但 是 ， 即 使 采用 位 操作 ， 
时 间 复 杂 度 仍 为 O (log, v) ，log; v 为 二 进 制 数 的 位 数 。 那 么 ， 还 能 
能 再 降低 一 些 复杂 度 呢 ? 如 果 有 办 法 让 算法 的 复杂 度 只 与 “1 的 个 效 有 
关 ， 复杂 度 不 就 能 进一步 降低 了 吗 ? 


同样 用 10100001 来 举例 。 如 果 只 考虑 和 1 的 个 数 相 关 ， 那 么 ， 我 们 
是 否 能够 在 每 次 判断 中 ， 仅 与 1 来 进行 判断 呢 ? 

为 了 简化 这 个 问题 ， 我 们 考虑 只 有 一 个 1 的 情况 。 例 如 : 
01000000。 

如 何 判断 给 定 的 二 进 制 数 里 面 有 且 仅 有 一 个 1 呢 ? 可 以 通过 判断 这 
个 数 是 否 是 2 的 整数 次 窜 来 实现 。 另 外 ， 如 果 只 和 这 一 个 “1” 进 行 判 
断 ， 如 何 设计 操作 呢 ? 我 们 知道 的 是 ， 如 果 进 行 这 个 操作 ， 结 果 为 0 或 
为 1， 就 可 以 得 到 结论 。 

如 果 希 望 操作 后 的 结果 为 0，01000000 可 以 和 00111111 进 行 “ 与 ” 操 
作 。 

这 样 ， 要 进行 的 操作 就 是 01000000 & (01000000 一 00000001) = 
01000000 & 00111111=0。 

因此 就 有 了 解法 三 的 代码 : 
代码 清单 2-3 


【解法 四 】 使 用 分 支 操 作 
解法 三 的 复杂 度 降低 到 O (M) ， 其 中 M 是 v 中 1 的 个 数 ， 可 能 会 有 
人 已 经 很 满足 了 ， 只 用 计算 1 的 位 数 ， 这 样 应 该 够 快 了 吧 。 然 而 我 们 说 
既然 只 有 八 位 数据 ， 索 性 直接 把 0 一 255 的 情况 都 罗列 出 来 ， 并 使 用 分 
支 操作 ， 可 以 得 到 答案 ， 代 码 如 下 : 
代码 清单 2-4 


解法 四 看 似 很 直接 ， 但 实际 执行 效率 可 能 会 低 于 解法 二 和 解法 
三 ， 因 为 分 支 语 句 的 执行 情况 要 看 具体 字 节 的 值 ， 如 果 a 二 0， 那 自然 
在 第 1 个 case 就 得 出 了 答案 ， 但 是 如 果 a 二 255， 则 要 在 最 后 一 个 case 才 得 
出 答案 ， 即 在 进行 了 255 次 比较 操作 之 后 ! 

看 来 ， 解 法 四 不 可 取 ! 但 是 解法 四 提供 了 一 个 思路 ， 就 是 采用 空 
间 换 时 间 的 方法 ， 罗 列 并 直接 给 出 值 。 如 果 需 要 快速 地 得 到 结果 ， 可 
以 利用 空间 或 利用 已 知 结论 。 这 就 好 比 已 经 知道 计算 1 十 2 十 ... 十 N 的 公 
式 ， 在 程序 实现 中 就 可 以 利用 公式 得 到 结论 。 

最 后 ， 得 到 解法 五 : 算法 中 不 需要 进行 任何 的 比较 便 可 直接 返回 
答案 ， 这 个 解法 在 时 间 复 杂 度 上 应 该 能 够 直人 高 山 铮 止 了 。 
[解法 五 】 查 表 法 


代码 清单 2-5 


/* 预定 义 的 结果 表 * 


这 是 个 典型 的 空间 换 时 间 的 算法 ， 把 0~255 中 “1” 的 个 数 直 接 存 储 
在 数组 中 ，v 作 为 数组 的 下 标 ，countTable[v] 就 是 v 中 “1” 的 个 数 。 算 法 
的 时 间 复 杂 度 仅 为 O (1) 。 

在 一 个 需要 频繁 使 用 这 个 算法 的 应 用 中 ， 通 过 “空间 换 时 间 ” 来 获 
取 高 的 时 间 效 率 是 一 个 常用 的 方法 ， 具 体 的 算法 还 应 针对 不 同 应 用 进 
行 优化 。 


扩展 问题 


1. 如 果 变 量 是 32 位 的 DWORD ， 你 会 使 用 上 述 的 哪 一 个 算法 ， 或 
者 改进 哪 一 个 算法 ? 

2. 另 一 个 相关 的 问题 ， 给 定 两 个 正 整 数 〈 二 进 制 形式 表示 ) A 和 
B， 问 把 A 变 为 B 需 要 改变 多 少 位 (bit) ? 也 就 是 说 ， 整数 A 和 B 的 二 进 
制 表 示 中 有 多 少 位 是 不 同 的 ? 


2.2 ”不 要 被 阶乘 吓 倒 


阶乘 (Factorial) 是 个 很 有 意思 的 国 数 ， 但 是 不 少 人 都 比较 怕 它 ， 
我 们 来 看 看 两 个 与 阶乘 相关 的 问题 : 

1. 给 定 一 个 整数 N， 那 么 N 的 阶乘 N! 末尾 有 多 少 个 0 呢 ? 例如 : 
N= 二 10，N! 三 3628800，NT1! 的 末尾 有 两 个 0。 

2. 求 N! 的 二 进 制 表示 中 最 低位 1 的 位 置 。 
分 析 与 解法 

有 些 人 碰 到 这 样 的 题目 会 想 : 是 不 是 要 完整 计算 出 N! 的 值 ? 如 果 
溢出 怎么 办 ? 事实 上 ， 如 果 我 们 从 “哪些 数 相 乘 能 得 到 10” 这 个 角度 来 
考虑 ， 问 题 就 变 得 简单 了 。 

首先 考虑 ， 如 果 N! 三 Kx10M ， 且 K 不 能 被 10 整 除 ， 那 么 N! 末尾 
有 M 个 0。 再 考虑 对 N! 进行 质 因 数 分 解 ，N! = (2x) x (37) x (5z 
) ...， 由 于 10 二 2x5， 所 以 M 只 跟 X 和 Zz 相关， 每 一 对 2 和 5 相 乘 可 以 得 到 
一 个 10， 于 是 M 二 min (X，Z) 。 不 难看 出 X 大 于 等 于 Zz， 因 为 能 被 2 整 
除 的 数 出 现 的 频率 比 能 被 5 整除 的 数 高 得 多 ， 所 以 把 公式 简化 为 M= 
Zs 

根据 上 面 的 分 析 ， 只 要 计算 出 Zz 的 值 ， 就 可 以 得 到 N! 末尾 0 的 个 
数 。 
【问题 1 的 解法 一 】 

要 计算 Z， 最 直接 的 方法 ， 就 是 计算 i (i 二 1，2，...，N) 的 因 式 
分 解 中 5 的 指数 ， 然 后 求 和 : 
代码 清单 2-6 


【问题 1 的 解法 二 】 
公式 : Z=[N/5] 十 [N/52 ] 十 [N/53 ] 十 ..，( 不 用 担心 这 会 是 一 个 无 穷 
的 运算 ， 因 为 总 存在 一 个 K， 使 得 5K >N，[NSK ] 二 0。) 
公式 中 ，[N/5] 表 示 不 大 于 N 的 数 中 5 的 倍数 贡献 一 个 5，[N/5? ] 表 示 
不 大 于 N 的 数 中 5? 的 倍数 再 贡献 一 个 5，.……. 代码 如 下 : 
ret = 0; 


while (N) 
{ 


二 


ret += N / 9; 
N /= 5; 
} 


问题 2 要 求 的 是 N! 的 二 进 制 表示 中 最 低位 1 的 位 置 。 给 定 一 个 整数 
N， 求 N! 二 进 制 表 示 的 最 低位 1 在 第 几 位 ? 例如 : 给 定 N=3，N1! = 
6， 那 么 N! 的 二 进 制 表 示 (1010) 的 最 低位 1 在 第 二 位 。 

为 了 得 到 更 好 的 解法 ， 首 先 要 对 题目 进行 一 下 转化 。 

首先 来 看 一 下 一 个 二 进 制 数 除 以 2 的 计算 过 程 和 结果 是 怎样 的 。 

把 一 个 二 进 制 数 除 以 2， 实 际 过 程 如 下 : 

判断 最 后 一 个 二 进 制 位 是 否 为 0， 若 为 0， 则 将 此 二 进 制 数 右 移 一 
位 ， 即 为 商 值 (为什么) ; 反之 ， 若 为 1， 则 说 明 这 个 二 进 制 数 是 奇 
数 ， 无 法 被 2 整除 (这 又 是 为 什么 ) 。 

所 以 ， 这 个 问题 实际 上 等 同 于 求 N! 含有 质 因数 2 的 个 数 。 即 答案 
等 于 N! 含有 质 因 数 2 的 个 数 加 1。 


【问题 2 的 解法 一 】 


由 于 N! 中 含有 质 因 数 2 的 个 数 ， 等 于 N/2 十 N/4 十 N/8 十 N/16 十 …2 
根据 上 述 分 析 ， 得 到 具体 算法 ， 如 下 所 示 : 
代码 清单 2-7 


westOne (int N) 


【问题 2 的 解法 二 ]】 
N! 含有 质 因 数 2 的 个 数 ， 还 等 于 N 减 去 N 的 二 进 制 表 示 中 1 的 数 
目 。 我 们 还 可 以 通过 这 个 规律 来 求解 。 
下 面 对 这 个 规律 进行 举例 说 明 ， 假 设 N=11011， 那 么 N! 中 含有 质 
因数 2 的 个 数 为 N/2 十 N/4 十 N/8 十 N/16 十 .…. 
即 : 1101 十 110 十 11 十 1 
二 (1000 十 100 十 1) 
十 (100 十 10) 
十 (10 十 1) 
十 1 
一 (1000 十 100 十 10 十 1) 十 〈100 十 10 十 1) 十 1 
二 1111 十 111 十 1 
三 (10000 一 1) 十 (1000 一 1) 十 (10 一 1) 十 (1 一 1) 
二 11011 一 NN 二 进 制 表示 中 1 的 个 数 
小 结 


任意 一 个 长 度 为 m 的 二 进 制 数 N 可 以 表示 为 N= 二 b[1] 十 b[2]*2 十 
b[3]*22 十 ... 十 b[m]*2 -0 ， 其 中 b[i] 表 示 此 二 进 制 数 第 i 位 上 的 数字 


(1 或 0)  。 所 以 ， 若 最 低位 b[1] 为 1， 则 说 明和 N 为 奇数 ; 反之 为 偶数 ， 
将 其 除 以 >， 即 等 于 将 整个 二 进 制 数 向 低位 移 一 位 。 
相关 题目 

给 定 整数 "7， 判 断 它 是 否 为 2 的 方 窜 (解答 提示 : n>>0&& ( (ng 
(n=—=1) -es0) 


2.3 ”寻找 发 帖 “水 王 ” 


Tango 是 微软 亚洲 研究 院 的 一 个 试验 项 目 。 研 究 院 的 员工 和 实习 生 
们 都 很 喜欢 在 Tango 上 面 交 流 治水。 传说 ，Tango 有 一 大 “水 王 *， 他 不 但 
喜欢 发 贴 ， 还 会 回复 其 他 ID 发 的 每 个 帖子 。 坊 间 风 闻 该 “水 王 ” 发 帖 数 
目 超过 了 帖子 总 数 的 一 半 。 如 果 你 有 一 个 当前 论坛 上 所 有 帖子 (包括 
回帖 ) 的 列表 ， 其 中 帖子 作者 的 ID 也 在 表 中 ， 你 能 快速 找 出 这 个 传说 
中 的 Tango 水 王 吗 ? 

分 析 与 解法 

首先 想到 的 是 一 个 最 直接 的 方法 ， 我 们 可 以 对 所 有 ID 进行 排序 。 
然后 再 扫描 一 遍 排 好 序 的 ID 列表 ， 统 计 各 个 ID 出 现 的 次 数 。 如 果 某 个 
ID 出 现 的 次 数 超过 总 数 的 一 半 ， 那 么 就 输出 这 个 ID。 这 个 算法 的 时 间 
复杂 度 为 O(N*log, N 十 N) 。 

如 果 ID 列 表 已 经 是 有 序 的 ， 还 需要 扫描 一 遍 整 个 列表 来 统计 各 个 
ID 出 现 的 次 数 吗 ? 

如 果 一 个 ID 出 现 的 次 数 超过 总 数 N 的 一 半 。 那 么 ， 无 论 水 王 的 ID 是 
什么 ， 这 个 有 序 的 ID 列表 中 的 第 N2 项 (从 0 开始 编号 ) 一 定 会 是 这 个 
ID (读者 可 以 试 着 证 明 一 下 ) 。 省 去 重新 扫描 一 遍 列 表 ， 可 以 节省 一 
点 算法 耗费 的 时 间 。 如 果 能 够 迅速 定位 到 列表 的 某 一 项 (比如 使 用 数 
组 来 存储 列表 ) ， 除 去 排序 的 时 间 复 杂 度 ， 后 处 理 需要 的 时 间 为 O 

(1) 。 

但 上 面 两 种 方法 都 需要 先 对 ID 列 表 进 行 排序 ， 时 间 复 杂 度 方面 没 
有 本 质 的 改进 。 能 否 避 免 排序 呢 ? 

如 果 每 次 删除 两 个 不 同 的 ID (不 管 是 否 包 含 “ 水 王 ” 的 ID) ， 那 
么 ， 在 剩 下 的 ID 列 表 中 ，“ 水 王 *ID 出 现 的 次 数 仍 然 超过 总 数 的 一 半 。 
看 到 这 一 点 之 后 ， 就 可 以 通过 不 断 重复 这 个 过 程 ， 把 ID 列 表 中 的 ID 总 
数 降 低 (转化 为 更 小 的 问题 ) ， 从 而 得 到 间 题 的 答案 。 新 的 思路 ， 避 


免 了 排序 这 个 耗 时 的 步骤 ， 总 的 时 间 复 杂 度 只 有 O (N) ， 且 只 需要 常 
数 的 额外 内 存 。 伪 代码 如 下 : 
代码 清单 2-8 


t nTimes, ; 


在 这 个 题目 中 ， 有 一 个 计算 机 科学 中 很 普遍 的 思想 ， 就 是 如 何 把 
一 个 间 题 转化 为 规模 较 小 的 若干 个 问题 。 分 冶 、 弟 推 和 贪心 等 都 是 基 
于 这 样 的 思路 。 在 转化 过 程 中 ， 小 的 问题 跟 原 问 题 本 质 上 一 致 。 这 
样 ， 我 们 可 以 通过 同样 的 方式 将 小 问题 转化 为 更 小 的 问题 。 因 此 ， 转 
化 过 程 是 很 重要 的 。 像 上 面 这 个 题目 ， 我 们 保证 了 问题 的 解 在 小 问题 
中 仍然 具有 与 原 问 题 相 同 的 性 质 : 水 王 的 ID 在 ID 列表 中 的 次 数 超过 一 
半 。 转 化 本 身 计 算 的 效率 越 高 ， 转 化 之 后 问题 规模 缩小 得 越 快 ， 则 整 
体 算 法 的 时 间 复 杂 度 越 低 。 


扩展 问题 
随 着 Tango 的 发 展 ， 管 理 员 发 现 , “超级 水 王 ” 没 有 了 。 统 计 结 果 表 


明 ， 有 3 个 发 帖 很 多 的 ID， 他 们 的 发 帖 数目 都 超过 了 帖子 总 数目 N 的 
1/4。 你 能 从 发 帖 ID 列表 中 快速 找 出 他 们 的 ID 吗 ? 


2.4 1 的 数目 


给 定 一 个 十 进 制 正 整数 N， 写 下 从 1 开始 ， 到 N 的 所 有 整数 ， 然 后 
数 一 下 其 中 出 现 的 所 有 “1” 的 个 数 。 

例如 : 

N= 二 2， 写 下 1，2。 这 样 只 出 现 了 1 个 “1”。 

N 王 12， 我 们 会 写 下 1，2，3，4，5，6，7，8，9，10，11，12。 
这 样 ，1 的 个 数 是 5。 


问题 是 : 
1. 写 一 个 函数 f (N) ， 返 回 1 到 N 之 间 出 现 的 “1” 的 个 数 ， 比 如 f 
(12) =5。 


2. 在 32 位 整数 范围 内 ， 满 足 条 件 “f (N) = 二 N”* 的 最 大 的 N 是 多 
少 ? 

分 析 与 解法 
【问题 1 的 解法 一 】 

这 个 问题 看 上 去 并 不 是 一 个 困难 的 问题 ， 因 为 不 需要 太 多 的 思 
考 ， 我 想 大 家 都 能 找到 一 个 最 简单 的 方法 来 计算 f (N) ， 那 就 是 从 1 开 
始 遍 历 到 N， 将 其 中 每 一 个 数 中 含有 “1 的 个 数 加 起 来 ， 自 然 就 得 到 了 
从 1 到 N 所 有 “1” 的 个 数 的 和 。 写 成 程序 如 下 : 
代码 清单 2-9 


return iCount,; 


这 个 方法 很 简单 ， 只 要 学 过 一 点 编程 知识 的 人 都 能 想到 ， 实 现 也 
很 简单 ， 容 易 理 解 。 但 是 这 个 算法 的 致命 问题 是 效率 ， 它 的 时 间 复 杂 
度 是 

O(N) x 计算 一 个 整数 数字 里 面 “1” 的 个 数 的 复杂 度 ==O (N*log， 
N) 

如 果 给 定 的 N 比 较 大 ， 则 需要 很 长 的 运算 时 间 才 能 得 到 计算 结果 。 
比如 在 笔者 的 机 器 上 ， 如 果 给 定 N= 二 100000000， 则 算出 f (N) 大 概 需 
要 40 秒 的 时 间 ， 计 算 时 间 会 随 着 N 的 增 大 而 线性 增长 。 

看 起 来 要 计算 从 1 到 NN 的 数字 中 所 有 1 的 和 ， 至 少 也 得 遍历 1 到 NN 之 
间 所 有 的 数字 才能 得 到 。 那 么 能 不 能 找到 快 一 点 的 方法 来 解决 这 个 问 
题 呢 ? 要 提高 效率 ， 必 须 按 弃 这 种 遍历 1 到 N 所 有 数字 来 计算 f (N) 的 
方法 ， 而 应 采用 另外 的 思路 来 解决 这 个 问题 。 

【问题 1 的 解法 二 】 


仔细 分 析 这 个 间 题 ， 给 定 了 N， 似 乎 就 可 以 通过 分 析 “ 小 于 N 的 数 
在 每 一 位 上 可 能 出 现 1 的 次 数 ” 之 和 来 得 到 这 个 结果 。 让 我 们 来 分 析 一 


下 对 于 一 个 特定 的 N， 如 何 得 到 一 个 规律 来 分 析 在 每 一 位 上 所 有 出 现 1 
的 可 能 性 ， 并 求 和 得 到 最 后 的 f (N) 。 

先 从 一 些 简单 的 情况 开始 观察 ， 看 看 能 不 能 总 结 出 什么 规律 。 

先 看 1 位 数 的 情况 。 

如 果 N 三 3， 那 么 从 1 到 3 的 所 有 数字 : 1、2、3， 只 有 个 位 数字 上 可 
能 出 现 1， 而 且 只 出 现 1 次 ， 进 一 步 可 以 发 现 如 果 N 是 个 位 数 ， 如 果 N>> 
=1， 那 么 f (N) 都 等 于 1， 如 果 N 二 0， 则 f (N) 为 0。 

再 看 2 位 数 的 情况 。 

如 果 N= 三 13， 那 么 从 1 到 13 的 所 有 数字 : 1、2、3、4、5、6、7、 
8、9、10、11、12、13， 个 位 和 十 位 的 数字 上 都 可 能 有 1， 我 们 可 以 将 
它们 分 开 来 考虑 ， 个 位 出 现 1 的 次 数 有 两 次 : 1 和 11， 十 位 出 现 1 的 次 数 
有 4 次 : 10、11、12 和 13， 所 以 f (N) = 二 2 十 4 二 6。 要 注意 的 是 11 这 个 
数字 在 十 位 和 个 位 都 出 现 了 1， 但 是 11 恰 好 在 个 位 为 1 和 十 位 为 1 中 被 计 
算 了 两 次 ， 所 以 不 用 特殊 处 理 ， 是 对 的 。 表 考虑 N= 二 23 的 情况 ， 它 和 N 
二 13 有 点 不 同 ， 十 位 出 现 1 的 次 数 为 10 次 ， 从 10 到 19， 个 位 出 现 1 的 次 
数 为 1、11 和 21， 所 以 f (N) = 二 3 十 10 二 13。 通 过 对 两 位 数 进行 分 析 ， 
我 们 发 现 ， 个 位 数 出 现 1 的 次 数 不 仅 和 个 位 数字 有 关 ， 还 和 十 位 数 有 
关 : 如 果 N 的 个 位 数 大 于 等 于 1， 则 个 位 出 现 1 的 次 数 为 十 位 数 的 数字 加 
1; 如 果 N 的 个 位 数 为 0， 则 个 位 出 现 1 的 次 数 等 于 十 位 数 的 数字 。 而 十 
位 数 上 出 现 1 的 次 数 不 仅 和 十 位 数 有 关 ， 还 和 个 位 数 有 关 : 如 果 十 位 数 
字 等 于 1， 则 十 位 数 上 出 现 1 的 次 数 为 个 位 数 的 数字 加 1; 如果 十 位 数 大 
于 1， 则 十 位 数 上 出 现 1 的 次 数 为 10。 

f (13) = 个 位 出 现 1 的 个 数 + 十 位 出 现 1 的 个 数 = 2 + 4 = 6; 

f£ (23) = 个 位 出 现 1 的 个 数 + 十 位 出 现 1 的 个 数 = 3 + 10 = 13; 
fE(33) = 个 位 出 现 1 的 个 数 + 十 位 出 现 1 的 个 数 = 4 + 10 = 14; 
£ (93) = 个 位 出 现 1 的 个 数 + 十 位 出 现 1 的 个 数 = 10 + 10 = 20; 

接着 分 析 3 位 数 。 

如 果 N 三 123: 

个 位 出 现 1 的 个 数 为 13: 1，11，21，...，91，101，111，121 

十 位 出 现 1 的 个 数 为 20: 10~19，110~119 


百 位 出 现 1 的 个 数 为 24: 100~123 

f (23) 三 个 位 出 现 1 的 个 数 十 十 位 出 现 1 的 个 数 十 百 位 出 现 1 的 次 数 
一 13 十 20 十 24 一 57; 

同 理 我 们 可 以 再 分 析 4 位 数 、5 位 数 。 读 者 朋友 们 可 以 写 一 写 ， 总 
结 一 下 各 种 情况 有 什么 不 同 。 

根据 上 面 的 一 些 党 试 ， 下 面 我 们 推导 出 一 般 情 况 下 ， 从 N 得 到 f 

(N) 的 计算 方法 : 

假设 N 三 abcde， 这 里 a、b、c、d、e 分 别 是 十 进 制 数 N 的 各 个 数位 
上 的 数字 。 如 果 要 计算 百 位 上 出 现 1 的 次 数 ， 它 将 会 受到 三 个 因素 的 影 
响 : 百 位 上 的 数字 ， 百 位 以 下 (低位 ) 的 数字 ， 百 位 (更 高 位 ) 以 上 
的 数字 。 

如 果 百 位 上 的 数字 为 0， 则 可 以 知道 ， 百 位 上 可 能 出 现 1 的 次 数 由 
更 高 位 决定 ， 比 如 12013， 则 可 以 知道 百 位 出 现 1 的 情况 可 能 是 100 人 ~ 
199，1100~1199，2100~2199，...，11100~11199， 一 共有 1200 个 。 
也 就 是 由 更 高 位 数字 (12) 决定 ， 并 且 等 于 更 高 位 数字 (12) x 当前 位 
数 (100) 。 

如 果 百 位 上 的 数字 为 1， 则 可 以 知道 ， 百 位 上 可 能 出 现 1 的 次 数 不 
仅 受 更 高 位 影响 ， 还 受 低 位 影响 ， 也 就 是 由 更 高 位 和 低位 共同 决定 。 
例如 对 于 12113， 受 更 高 位 影响 ， 百 位 出 现 1 的 情况 是 100~199，1100 
~1199，2100~2199，...，11100~11199， 一共 1200 个 ， 和 上 面 第 一 种 
情况 一 样 ， 等 于 更 高 位 数字 (12) x 当前 位 数 (100) 。 但 是 它 还 受 低 
位 影响 ， 百 位 出 现 1 的 情况 是 12100 人 12113， 一 共 114 个 ， 等 于 低位 数 
字 (123) 十 1。 

如 果 百 位 上 数字 大 于 1 ( 即 为 2~9) ， 则 百 位 上 可 能 出 现 1 的 次 数 
也 仅 由 更 高 位 决定 ， 比 如 12213， 则 百 位 出 现 1 的 可 能 性 为 : 100~~ 
199,，1100~1199，2100~2199, ...，11100~11199，12100~12199， 
一 共有 1300 个 ， 并 且 等 于 更 高 位 数字 十 1 (12 十 1) x 当前 位 数 

(100) 。 
通过 上 面 的 归纳 和 总 结 ， 我 们 可 以 写 出 如 下 的 更 高 效 算法 来 计算 f 
(N) : 


代码 清单 2-10 


LONGLONG Sumls (ULONGLONG n) 


ULONGLONG iCount = 0); 
ULONGL r 
LON VerzN 
LONGLONG urrNum 0 
LONGL iHigherNunm 
hilel(n F r 0) 
rN ( iFa } t 
UrrNum = 人 tor) 
Higher (iFactor )) 
1 (iCurrNum) 
iCount iHig m iFa 
preak 
iCoun = iHighe T iFa + LowerNum 
bx 
defaul 
i in = (iHigherNum ) 
r ak 
iFactor ] 
1 nt 


这 个 方法 只 要 分 析 N 就 可 以 得 到 f (N) ， 避 开 了 从 1 到 N 的 遍历 ， 
输入 长 度 为 Len 的 数字 N 的 时 间 复 杂 度 为 O (Len) ， 即 为 O (In (n) /In 
(10) 十 1) 。 在 笔者 的 计算 机 上 ， 计 算 N==100000000， 相 对 于 第 一 种 
方法 的 40 秒 时 间 ， 这 种 算法 不 到 1 毫秒 就 可 以 返回 结果 ， 速 度 至 少 提 高 
了 40000 倍 。 


【问题 2 的 解法 】 


要 确定 最 大 的 数 N， 满 足 f (N) 三 N。 我 们 通过 简单 的 分 析 可 以 知 
道 (仿照 上 面 给 出 的 方法 来 分 析 ) : 


9 以 下 为 : LA 

99 以 下 为 : 1x10+10x1=20 个， 

999 以 下 为 : 1x100+10x20=300 个 ; 

9999 0 : 1x1000+10x300=4000 个 ; 
999999999 以 下 为 S 900000000 个 ; 
9999999999 以 下 为 : 10000000000 个 。 


容易 从 上 面 的 式 子 归纳 出 : f (10"-1) = 二 n*10"”1。 通 过 这 个 递 推 
式 ， 很 容易 看 到 ， 当 n 王 9 时 候 ，f (n) 的 开始 值 大 于 n， 所 以 我 们 可 以 
猜想 ， 当 n 大 于 某 一 个 数 N 时 ，f (n) 会 始终 比 np 大 ， 也 就 是 说 ， 最 大 满 
足 条 件 在 0~N 之 间 ， 亦 即 N 是 最 大 满足 条 件 f (n) ==n 的 一 个 上 界 。 如 
果 能 估计 出 这 个 N， 那 么 只 要 i 上 n 从 N 往 0 递减 ， 每 个 分 别 检查 是 否 有 f 

(n) = 二 n， 第 一 个 满足 条 件 的 数 就 是 我 们 要 求 的 整数 。 

因此 ， 问 题 转化 为 如 何 证 明 上 界 N 确 实 存在 ， 并 估计 出 这 个 上 界 
N。 

证 明 满 足 条 件 f (n) =n 的 数 存在 一 个 上 界 

首先 ， 用 类 似 数 学 归纳 法 的 思路 来 推理 这 个 问题 。 很 容易 得 到 下 
面 这 些 结论 (读者 朋友 可 以 自己 试 着 列举 验证 一 下 ) : 

当 n 增 加 10 时 ，f (n) 至 少 增加 1; 

当 n 增 加 100 时 ，f (n) 至 少 增加 20; 

当 n 增 加 1000 时 ，f (n) 至 少 增加 300 

当 n 增 加 10000 时 ，f (n) 至 少 增加 4000; 


当 n 增 加 10k 时 ，f (n) 至 少 增加 k*10*1。 

首先 ， 当 k>> 三 10 时 ，k*10k-1 之 10k ， 所 以 (n) 的 增加 量 大 于 n 
的 增加 量 。 

其 次 , f 〈1010-1) 三 1010 >1010-1。 如 果 存 在 N， 当 n 二 NB 时 , f 
(N) 一 N>1010 成 立时 ， 此 时 不 管 n 增 加 多 少 ，f (n) 的 值 将 始终 


大 于 n。 

具体 来 说 ， 设 n 的 增加 量 为 m: 当 m 小 于 101 -1 时 ， 由 于 f (N) 一 
N>>1010-1 ， 因 此 有 f (N 十 m) >f (N) >N 十 1010-1 >N 十 mm， 即 f 

(n) 的 值 仍然 比 n 的 值 大 ; 当 m 大 于 等 于 108 1 时，f (n) 的 增 量 始终 

En 的 增 量 大 ， 即 f (N 十 m) 一 f (N) > (N 十 m) 一 N， 也 就 是 f CN 十 
m) >f (N) +m>N 二 1010-1 十 m>N 十 m， 即 f (n) 的 值 仍然 比 n 的 
值 大 。 

因此 ， 对 于 满足 f (N) 一 N>101071 成 立 的 N 一 定 是 所 求 该 数 的 一 
个 上 界 。 

求 出 上 界 N 

又 由 于 f 〈1010 1 ) 三 nx*1010 1 ,不 妨 设 N= 二 10K“1 ， 有 f (10K 1 
) 一 (10K-1) >101 1 ， 即 K*lok-1 一 (10K1) >1000-1， 易 得 
K>> 三 11 时 候 均 满足 。 所 以 ， 当 K=11 时 ，N 三 101-1 即 为 最 小 一 个 上 
界 。 

计算 这 个 最 大 数 n 

令 N==1011 ”1 = 二 99999999999，i 上 n 从 N 往 0 递减 ， 每 个 分 别 检查 是 
否 有 f (n) = 二 n， 第 一 满足 条 件 的 就 是 我 们 要 求 的 整数 。 很 容易 解 出 n= 
1111111110 是 满足 f (n) ==n 的 最 大 整数 。 


扩展 问题 


对 于 其 他 进 制 表达 方式 ， 也 可 以 试 一 试 ， 看 看 有 什么 规律 。 例 如 
二 进 制 |: 

f (1) 三 1 

f (10) 三 10 (因为 01，10 有 两 个 1) 

f (11) 三 100 (因为 01，10，11 有 四 个 1) 

读者 朋友 可 以 模仿 我 们 的 分 析 方 法 ， 给 出 相应 的 解答 。 


2.5 “寻找 最 大 的 KK 个 数 


在 面试 中 ， 有 下 面 的 问答 : 
问 : 有 很 多 个 无 序 的 数 ， 我 们 姑且 假定 它们 各 不 相等 ， 怎 么 选 出 
其 中 最 大 的 若干 个 数 呢 ? 
可 以 这 样 写 : int array[100]..……. 
: 好 ， 如 果 有 更 多 的 元 素 呢 ? 
那 可 以 改 为 : int array[1000]..……. 
: 如 果 我 们 有 很 多 元 素 ， 例 如 1 亿 个 浮 点 数 ， 怎 么 办 ? 
ey 那 可 以 与 : float 
array[ 100000000]...... 


日 


只 可 螺 可 噶 


问 : 这 样 的 程序 能 编译 运行 么 ? 

答 : 咽 .……. 我 从 来 没 写 过 这 么 多 的 0.…… 
分 析 与 解法 
【解法 一 】 


当 学 生 们 信 笔 写 下 float array[10000000]， 他 们 往往 没有 想到 这 个 数 
据 结 构 要 如 何在 电脑 上 实现 ， 是 从 当前 程序 的 栈 (Stack) 中 分 配 ， 还 
是 堆 (Heap) ， 还 是 电脑 的 内 存 也 许 放 不 下 这 么 大 的 东西 ? 

我 们 先 假设 元 素 的 数量 不 大 ， 例 如 在 几 千 个 左右 ， 在 这 种 情况 
下 ， 那 我 们 就 排序 一 下 吧 。 在 这 里 ， 快 速 排序 或 堆 排序 都 是 不 错 的 选 
择 ， 他 们 的 平均 时 间 复 杂 度 都 是 O(N*log, N) 。 然 后 取出 前 K 个 ，O 

(K) 。 总 时 间 复 杂 度 O(N*log, N) 十 O (K) =O (N*log, N) 。 

你 一 定 注意 到 了 ， 当 K= 二 1 时， 上 面 的 算法 也 是 O(N*log, N) 的 复 
杂 度 ， 而 显然 我 们 可 以 通过 N 一 1 次 的 比较 和 交换 得 到 结果 。 上 面 的 算 
法 把 整个 数组 都 进行 了 排序 ， 而 原 题 目 只 要 求 最 大 的 K 个 数 ， 并 不 需要 
前 人 个 数 有 序 ， 也 不 需要 后 N 一 多 个 数 有 序 。 


怎么 能 够 避免 做 后 N 一 K 个 数 的 排序 呢 ? 我 们 需要 部 分 排序 的 算 
法 ， 选 择 排序 和 交换 排序 都 是 不 错 的 选择 。 把 N 个 数 中 的 前 K 大 个 数 排 
序 出 来 ， 复 杂 度 是 O (N*K) 。 

那 一 个 更 好 呢 ? O(N*log, N) 还 是 O (N*K) ? 这 取决 于 K 的 大 
小 ， 这 是 你 需要 在 面试 者 那里 弄 清楚 的 问题 。 在 K (K<=log, N) 较 
小 的 情况 下 ， 可 以 选择 部 分 排序 。 

在 下 一 个 解法 中 ， 我 们 会 通过 避免 对 前 K 个 数 排序 来 得 到 更 好 的 性 
能 。 

【解法 二 】 

回忆 一 下 快速 排序 ， 快 排 中 的 每 一 步 ， 都 是 将 待 排 数据 分 做 两 
组 ， 其 中 一 组 的 数据 的 任何 一 个 数 都 比 另 一 组 中 的 任何 一 个 大 ， 然 后 
再 对 两 组 分 别 做 类 似 的 操作 ， 然 后 继续 下 去 .……… 

在 本 问题 中 ， 假 设 N 个 数 存 储 在 数组 Ss 中 ， 我 们 从 数组 $ 中 随机 找 出 
一 个 元 素 X， 把 数组 分 为 两 部 分 S$, 和 Si 。S, 中 的 元 素 大 于 等 于 X，S， 
中 元 素 小 于 X。 

这 时 ， 有 两 种 可 能 性 : 

1. S, 中 元 素 的 个 数 小 于 K，S, 中 所 有 的 数 和 Si 中 最 大 的 K 一 |S, | 
个 元 素 (|S; | 指 S, 中 元 素 的 个 数 ) 就 是 数组 Ss 中 最 大 的 K 个 数 。 

2. S, 中 元 素 的 个 数 大 于 或 等 于 K， 则 需要 返回 S, 中 最 大 的 K 个 元 

这 样 递归 下 去 ， 不 断 把 问题 分 解 成 更 小 的 问题 ， 平 均 时 间 复 杂 度 O 

(N*log, K) 。 伪 代码 如 下 : 
代码 清单 2-11 


if (Kk = ) 
return [] 1/ 返回 空 数 组 
ft (lengt S ) 
return 
( Sbh) = Par lon (5S) 
rt ig (Sa ) pend (Kk (Sk ng ) 
Par ion(S): 
Sa = 站] // 初始 化 为 空 数组 
Sb = [] // 初始 化 为 空 数组 
'/ 随机 选择 一 个 数 作为 分 组 标准 ， 以 避免 特殊 数据 下 的 算法 退化 
' 也 可 以 通过 对 整个 数据 进行 洗 牌 预 处 理 实现 这 个 目的 
Swap(S[1], S[Random() % length S]) 
fo i | length 5S] : 
> PP ?了 Sa.Append(S[i]) : Sb.Append(S[1i]) 
// 将 p 加 入 较 小 的 组 ， 可 以 避免 分 组 失败 ， 也 使 分 组 更 均匀 ， 提 高 效率 
length S。< length Sb ? Sa.APPena(P) : Sb.Append (p) 


【解法 三 

寻找 N 个 数 中 最 大 的 K 个 数 ， 本 质 上 就 是 寻找 最 大 的 K 个 数 中 最 小 
的 那个 ， 也 就 是 第 K 大 的 数 。 可 以 使 用 二 分 搜索 的 策略 来 寻找 N 个 数 中 
的 第 K 大 的 数 。 对 于 一 个 给 定 的 数 p， 可 以 在 O (N) 的 时 间 复 杂 度 内 找 
出 所 有 不 小 于 p 的 数 。 假 如 N 个 数 中 最 大 的 数 为 V,、， 最 小 的 数 为 Vi， 
， 那 么 这 N 个 数 中 的 第 K 大 数 一 定 在 区 间 [Vi，Vuwayx ] 之 间 。 那 么 ， 可 
以 在 这 个 区 间 内 二 分 搜索 N 个 数 中 的 第 K 大 数 p。 伪 代码 如 下 : 
代码 清单 2-12 


while (Vmax Vmin > delta) 


mid vmin (Vmax min) ( 
f(£( ; N, Vmid) >= K) 
m Vmid; 
els 
n mid 


伪 代 码 中 f (ar，N，V%wiq ) 返回 数组 ar[0，...，N 一 1 中 大 于 等 于 
Vnmid 的 数 的 个 数 。 


上 述 伪 代码 中 ，delta 的 取 值 要 比 所 有 NN 个 数 中 的 任意 两 个 不 相等 的 
元 素 差 值 之 最 小 值 小 。 如 果 所 有 元 素 都 是 整数 ，delta 可 以 取 值 0.5。 循 
环 运行 之 后 ， 得 到 一 个 区 间 (Vi ，V%,、 ) ， 这 个 区 间 仅 包含 一 个 元 
素 (或 者 多 个 相等 的 元 素 ) 。 这 个 元 素 就 是 第 K 大 的 元 素 。 整 个 算法 的 
时 间 复 杂 度 为 O(N*log。 (|V yx 一 Vi ldelta) ) 。 由 于 delta 的 取 值 要 
比 所 有 N 个 数 中 的 任意 两 个 不 相等 的 元 素 差 值 之 最 小 值 小 ， 因 此 时 间 复 
杂 度 跟 数 据 分 布 相 关 。 在 数据 分 布 平均 的 情况 下 ， 时 间 复 杂 度 为 O 

(N*:log, (N) ) 。 

在 整数 的 情况 下 ， 可 以 从 另 一 个 角度 来 看 这 个 算法 。 假 设 所 有 整 
数 的 大 小 都 在 [0，22-!] 之 间 ， 也 就 是 说 所 有 整数 在 二 进 制 中 都 可 以 用 
m bit 来 表示 (从 低位 到 高 位 ， 分 别 用 0，1，...，m 一 1 标记 ) 。 我 们 可 
以 先 考察 在 二 进 制 位 的 第 (m 一 1) 位 ， 将 N 个 整数 按 该 位 为 1 或 者 0 分 
成 两 个 部 分 。 也 就 是 将 整数 分 成 取 值 为 0，2m 1 一 可 和 [2m 1 ，2 一 
1] 两 个 区 间 。 前 一 个 区 间 中 的 整数 第 Am 一 1) 位 为 0， 后 一 个 区 间 中 的 
整数 第 (m 一 1) 位 为 7。 如果 该 位 为 1 的 整数 个 数 A 大 于 等 于 K， 那 么 ， 
在 所 有 该 位 为 1 的 整数 中 继续 寻找 最 大 的 K 个 。 否 则 ， 在 该 位 为 0 的 整数 
中 寻找 最 大 的 K 一 A 个 。 接 着 考虑 二 进 制 位 第 (m 一 2) 位 ， 以 此 类 推 。 
思路 跟 上 面 的 浮 点 数 的 情况 本 质 上 一 样 。 

对 于 上 面 两 个 方法 ， 我 们 都 需要 遍历 一 遍 整 个 集合 ， 统 计 在 该 集 
合 中 大 于 等 于 某 一 个 数 的 整数 有 多 少 个 。 不 需要 做 随机 访问 操作 ， 如 
果 全 部 数据 不 能 载 入 内 存 ， 可 以 每 次 都 遍历 一 遍 文件 。 经 过 统计 ， 更 
新 解 所 在 的 区 间 之 后 ， 再 遍历 一 次 文件 ， 把 在 新 的 区 间 中 的 元 素 存 入 
新 的 文件 。 下 一 次 操作 的 时 候 ， 不 再 需要 遍历 全 部 的 元 素 。 每 次 需 
两 次 文件 遍历 ， 最 坏 情 况 下 ， 总 共 需 要 遍历 文件 的 次 数 为 2*]og， 

(va 一 Vmin |/delta) 。 由 于 每 次 更 新 解 所 在 区 间 之 后 ， 元 素数 目 会 
减少 。 当 所 有 元 素 能 够 全 部 载 入 内 存 之 后 ， 就 可 以 不 再 通过 读 写 文件 
的 方式 来 操作 了 。 

此 外 ， 寻 找 N 个 数 中 的 第 K 大 数 ， 是 一 个 经 典 问题 。 理 论 上 ， 这 个 

问题 存在 线性 算法 。 不 过 这 个 线性 算法 的 常数 项 比较 大 ， 在 实际 应 用 


中 效果 有 时 并 不 好 。 
【解法 四 】 

我 们 已 经 得 到 了 三 个 解法 ， 不 过 这 三 个 解法 有 个 共同 的 地 方 ， 就 
是 需要 对 数据 访问 多 次 ， 那 么 就 有 下 一 个 问题 ， 如 果 N 很 大 呢 ，100 
亿 ? (更 多 的 情况 下 ， 是 面试 者 问 你 这 个 问题 ) 。 这 个 时 候 数据 不 能 
全 部 装 入 内 存 〈 不 过 也 很 难说 ， 说 知道 以 后 会 不 会 1T 内 存 比 1 斤 白菜 还 
便宜 ) ， 所 以 要 求 尽 可 能 少 的 遍历 所 有 数据 。 

不 妨 设 N>K， 前 K 个 数 中 的 最 大 K 个 数 是 一 个 退化 的 情况 ， 所 有 K 
个 数 就 是 最 大 的 K 个 数 。 如 果 考 虑 第 K 十 1 个 数 X 呢 ?如 果 X 比 最 大 的 K 
个 数 中 的 最 小 的 数 Y 小 ， 那 么 最 大 的 K 个 数 还 是 保持 不 变 。 如 果 XE 此 Y 
大 ， 那 么 最 大 的 K 个 数 应 该 去 掉 Y， 而 包含 X。 如 果 用 一 个 数组 来 存储 
最 大 的 K 个 数 ， 每 新 加 入 一 个 数 X， 就 扫描 一 遍 数组 ， 得 到 数组 中 最 小 
的 数 Y。 用 X 蔡 代 Y， 或 者 保持 原 数组 不 变 。 这 样 的 方法 ， 所 耗费 的 时 
间 为 O (N*K) 。 

进一步 ， 可 以 用 容量 为 K 的 最 小 堆 来 存储 最 大 的 K 个 数 。 最 小 堆 的 
堆 顶 元 素 就 是 最 大 K 个 数 中 最 小 的 一 个 。 每 次 新 考虑 一 个 数 X， 如 果 X 
比 堆 顶 的 元 素 Y 小 ， 则 不 需要 改变 原来 的 堆 ， 因 为 这 个 元 素 比 最 大 的 K 
个 数 小 。 如 果 X 比 堆 顶 元 素 大 ， 那 么 用 X 替 换 堆 顶 的 元 素 Y。 在 X 替 换 
堆 顶 元 素 Y 之 后 ，X 可 能 破坏 最 小 堆 的 结构 (每 个 结 点 都 比 它 的 父亲 结 
点 大 ) ， 需 要 更 新 堆 来 维持 堆 的 性 质 。 更 新 过 程 花 费 的 时 间 复 杂 度 为 O 

(log， K) 。 


HI[3] ) “Hg | HI[5] HI[6] | 


图 2-1 


图 2-1 是 一 个 堆 ， 用 一 个 数组 h[] 表 示 。 每 个 元 素 h[fi]， 它 的 父 杀 结 
点 是 h[i/2]， 儿 子 结 点 是 h[2*i 十 1] 和 h[2*i 十 2]。 每 新 考虑 一 个 数 X， 需 
进行 的 更 新 操作 伪 代 码 如 下 : 
代码 清单 2-13 


0 
{ 
h[0] = 
Whileti ) 
上 
break; 
ER EL] SLAG 
9 Oo ] 
tf (h{q] h[P]) 
t hl[p) 
h[p] = hi{g 
hi{q] ‘ 
BD 《 


因此 ， 算 法 只 需要 扫描 所 有 的 数据 一 次 ， 时 间 复 杂 度 为 O(N*log， 
K) 。 这 实际 上 是 部 分 执行 了 堆 排 序 的 算法 。 在 空间 方面 ， 由 于 这 个 算 
法 只 扫描 所 有 的 数据 一 次 ， 因 此 我 们 只 需要 存储 一 个 容量 为 K 的 堆 。 大 
多 数 情况 下 ， 堆 可 以 全 部 载 入 内 存 。 如 果 K 仍 然 很 大 ， 我 们 可 以 党 试 先 
找 最 大 的 K“ 个 元 素 ， 然 后 找 第 K ' 十 1 个 到 第 2*K ' 个 元 素 ， 如 此 类 推 
(其 中 容量 K “的 堆 可 以 完全 载 入 内 存 ) 。 不 过 这 样 ， 我 们 需要 扫描 所 
有 数据 ceila (KK “ ) 次 。 

【解法 五 】 

上 面 类 快速 排序 的 方法 平均 时 间 复 杂 度 是 线性 的 。 能 否 有 确定 的 
线性 算法 呢 ? 是 否 可 以 通过 改进 计数 排序 、 基 数 排序 等 来 得 到 一 个 更 
高 效 的 算法 呢 ? 答案 是 肯定 的 。 但 算法 的 适用 范围 会 受到 一 定 的 限 
制 。 

如 果 所 有 NN 个 数 都 是 正 整数 ， 且 它们 的 取 值 范围 不 太 大 ， 可 以 考虑 
申请 空间 ， 记 录 每 个 整数 出 现 的 次 数 ， 然 后 再 从 大 到 小 取 最 大 的 K 个 。 
比如 ， 所 有 整数 都 在 (0，MAXN) 区 间 中 的 话 ， 利 用 一 个 数组 
count[MAXN] 来 记录 每 个 整数 出 现 的 个 数 〈count[i 表 示 整 数 i 在 所 有 整 
数 中 出 现 的 个 数 ) 。 我 们 只 需要 扫描 一 遍 就 可 以 得 到 count 数 组 。 然 
后 ， 寻 找 第 K 大 的 元 素 : 
代码 清单 2-14 


sumCount + 
if (sumCount >= K) 
break; 


极端 情况 下 ， 如 果 N 个 整数 各 不 相同 ， 我 们 甚至 只 需要 一 个 bit 来 存 
储 这 个 整数 是 否 存在 。 

当 实 际 情况 下 ， 并 不 一 定 能 保证 所 有 元 素 都 是 正 整数 ， 且 取 值 学 
围 不 太 大 。 上 面 的 方法 仍然 可 以 推广 适用 。 如 果 N 个 数 中 最 大 的 数 为 
Vmax ， 最 小 的 数 为 Van ， 我 们 可 以 把 这 个 区 间 [Vain ，Vnmax ] 分 成 M 


块 ， 每 个 小 区 间 的 跨度 为 d= (Vi, 一 Vy ) /M， 即 [V， ，Vni 十 
d]，[V ， 十 d，Vi 十 2d]，..….…... 然 后 ， 扫 描 一 遍 所 有 元 素 ， 统 计 各 个 
小 区 间 中 的 元 素 个 数 ， 跟 上 面 方法 类 似 地 ， 我 们 可 以 知道 第 K 大 的 元 素 
在 哪 一 个 小 区 间 。 然 后 ， 再 对 那个 小 区 间 ， 继 续 进行 分 块 处 理 。 这 个 
方法 介 于 解法 三 和 类 计数 排序 方法 之 间 ， 不 能 保证 线性 。 跟 解法 三 类 
似 地 ， 时 间 复 杂 度 为 O ( (N 十 M) *log, M (|V yx 一 Vi |/delta) ) 。 
遍历 文件 的 次 数 为 2*log, M (|V， ， 一 Vi |/delta) 。 当 然 ， 我 们 需要 找 
一 个 尽量 大 的 M， 但 M 取 值 要 受 内 存 限 制 。 

在 这 道 题 中 ， 我 们 根据 K 和 N 的 相对 大 小 ， 设 计 了 不 同 的 算法 。 在 
实际 面试 中 ， 如 果 一 个 面试 者 能 针对 一 个 问题 ， 说 出 多 种 不 同 的 方 
法 ， 并 且 分 析 它 们 各 自 适 用 的 情况 ， 那 一 定 会 给 人 留 下 深刻 印象 。 

注 : 本 题目 的 解答 中 用 到 了 多 种 排序 算法 ， 这 些 算法 在 大 部 分 的 
算法 书籍 中 都 有 讲解 。 掌 握 排序 算法 对 工作 也 会 很 有 帮助 。 
扩展 问题 


1. 如 果 需 要 找 出 N 个 数 中 最 大 的 K 个 不 同 的 浮 点 数 呢 ? 比如 ， 含 
有 10 个 浮 点 数 的 数组 (1.5，1.5，2.5，2.5，3.5，3.5，5，0，-1.5， 
3.5) 中 最 大 的 3 个 不 同 的 浮 点 数 是 5，3.5，2.5) 。 

2. 如 果 是 找 第 k 到 m (0<k<<=m 过 =n) 大 的 数 呢 ? 

3. 在 搜索 引擎 中 ， 网 络 上 的 每 个 网 页 都 有 “权威 性 ”权重 ， 如 page 
rank。 如 果 我 们 需要 寻找 权重 最 大 的 K 个 网 页 ， 而 网 页 的 权重 会 不 断 地 
更 新 ， 那 么 算法 要 如 何 变动 以 达到 快速 更 新 (incremental update) 并 及 
时 返回 权重 最 大 的 K 个 网 页 ? 

提示 : 堆 排 序 ? 当 每 一 个 网 页 权重 更 新 的 时 候 ， 更 新 堆 。 还 有 更 
好 的 方法 吗 ? 

4. 在 实际 应 用 中 ， 还 有 一 个 “精确 度 ” 的 问题 。 我 们 可 能 并 不 需要 
返回 严格 意义 上 的 最 大 的 K 个 元 素 ， 在 边界 位 置 允许 出 现 一 些 误差 。 当 
用 户 输 入 一 个 query 的 时 候 ， 对 于 每 一 个 文档 4 来 说 ， 它 跟 这 个 query 之 
间 都 有 一 个 相关 性 衡量 权重 f (query，d) 。 搜 索引 擎 需要 返回 给 用 户 


的 就 是 相关 性 权重 最 大 的 K 个 网 页 。 如 果 每 页 10 个 网 页 ， 用 户 不 会 关心 
第 1000 页 开外 搜索 结果 的 “精确 度 ”， 稍 有 误差 是 可 以 接受 的 。 比 如 我 
们 可 以 返回 相关 性 第 10001 大 的 网 页 ， 而 不 是 第 9999 大 的 。 在 这 种 情况 
下 ， 算 法 该 如 何 改进 才能 更 快 更 有 效率 呢 ? 网 页 的 数目 可 能 大 到 一 台 
机 器 无 法 容纳 得 下 ， 这 时 怎么 办 呢 ? 

提示 : 归并 排序 ? 如 果 每 台 机 器 都 返回 最 相关 的 K 个 文档 ， 那 么 
所 有 机 器 上 最 相关 K 个 文档 的 并 集 肯 定 包 含 全 集中 最 相关 的 K 个 文档 。 
由 于 边界 情况 并 不 需要 非常 精确 ， 如 果 每 台 机 器 返回 最 好 的 K“ 个 文 
档 ， 那 么 K“ 应 该 如 何 取 值 ， 以 达到 我 们 返回 最 相关 的 90%*K 个 文档 
是 完全 精确 的 ， 或 者 最 终 返 回 的 最 相关 的 K 个 文档 精确 度 超过 90% (最 
相关 的 K 个 文档 中 90% 以 上 在 全 集中 相关 性 的 确 排 在 前 K); ， 或 者 最 终 
返回 的 最 相关 的 K 个 文档 最 差 的 相关 性 排序 没有 超出 110%*K。 

5. 如 第 4 点 所 说 ， 对 于 每 个 文档 4， 相 对 于 不 同 的 关键 字 q; ，q， 
，...，gm ， 分 别 有 相 关 性 权重 f (d, qi) ，f (d，q ) ，.…，f (d， 
qm ) 。 如果 用 户 输入 关键 字 g; 之 后 ， 我 们 已 经 获得 了 最 相关 的 K 个 文 
档 ， 而 已 知 关键 字 q 跟 关 键 字 qi 相似 ， 文 档 跟 这 两 个 关键 字 的 权重 大 
小 比较 靠近 ， 那 么 关键 字 di 的 最 相关 的 K 个 文档 ， 对 寻找 qj 最 相关 的 K 
个 文档 有 没有 帮助 呢 ? 


2.6 ”精确 表达 浮 后 数 


在 计算 机 中 ， 使 用 float 或 者 double 来 存储 小 数 是 不 能 得 到 精确 值 
的 。 如 果 你 希望 得 到 精确 计算 结果 ， 最 好 是 用 分 数 形式 来 表示 小 数 。 
有 限 小 数 或 者 无 限 循环 小 数 都 可 以 转化 为 分 数 。 比 如 : 

0.9 王 9/10 

0.333 (3) 三 1/3 (括号 中 的 数字 表示 是 循环 节 ) 

当然 一 个 小 数 可 以 用 好 几 种 分 数 形式 来 表示 。 如 : 

0.333 (3) 三 1/3 三 3/9 

给 定 一 个 有 限 小 数 或 者 无 限 循环 小 数 ， 你 能 否 以 分 母 最 小 的 分 数 
形式 来 返回 这 个 小 数 呢 ? 如 果 输 入 为 循环 小 数 ， 循 环节 用 括号 标记 出 
来 。 下 面 是 一 些 可 能 的 输入 数据 ， 如 0.3、0.30、0.3 (000) 、0.3333 
(3933) 3 wn 


分 析 与 解法 

拿 到 这 样 一 个 问题 ， 我 们 往往 会 从 最 简单 的 情况 入 手 ， 因 为 所 有 
的 小 数 都 可 以 分 解 成 一 个 整数 和 一 个 纯 小 数 之 和 ， 不 妨 只 考虑 大 于 0， 
小 于 1 的 纯 小 数 ， 且 暂时 不 考虑 分 子 和 分 母 的 约 分 ， 先 设法 将 其 表示 为 
分 数 形式 ， 然 后 再 进行 约 分 。 题 目 中 输入 的 小 数 ， 要 么 为 有 限 小 数 X 二 
0.a1 ay .…an ， 要 么 为 无 限 循环 小 数 X 二 0.a1 ay ...an (bib;...bm) ，X 
表示 式 中 的 字母 al a, ...a ，bi b, .….b, 都 是 0~9 的 数字 ， 括 号 部 分 (bj 
b, ...bu ) 表示 循环 节 ， 我 们 需要 处 理 的 就 是 以 上 两 种 情况 。 

对 于 有 限 小 数 X 二 0.a1 a .….a, 来 说 ， 这 个 问题 比较 简单 ，X 就 等 于 

《的 人 0 

对 于 无 限 循环 小 数 X=0.al ay ...an (bl by .bn ) 来 说 ， 其 复杂 部 分 
在 于 小 数 点 后 同时 有 非 循 环 部 分 和 循环 部 分 ， 我 们 可 以 做 如 下 的 转 
换 : 

X=0.a1 av ...an (bi b， ...b，) 


S10 *X 一 al ao ...au (bib,...b,) 

S10° *X 一 al ay ...a, 十 0. (bj b,， ...b，) 

X= (al ay .a 十 0. (bi b, ...b，) ) /10n 

对 于 整数 部 分 al a, .….an ， 不 需要 做 额外 处 理 ， 只 需要 把 小 数 部 分 
转化 为 分 数 形式 再 加 上 这 个 整数 即 可 。 对 于 后 面 的 无 限 循环 部 分 ， 可 
以 采用 如 下 方式 进行 处 理 : 

令 Y= 二 0.b; b, ...b ， ， 和 那么 

10m *Y=b] by ...b， . (bj b， ...b，) 

之 10m *Y 王 bj b, ...b， +0. (bj by ...b，) 

一 10m *Y—Y=bi b;, ...b, 

SY=bi b, ...b, / (10m —1) 

将 Y 代 入 前 面 的 X 的 等 式 可 得 : 

X= (al ay ... 十 Y) /10n 

= (al as ...al 十 bi by ...by/ (10m 一 1) ) /10° 

= ( (ala.a)*(1I0om 一 1) 十 (bib,...b, ) ) / ( (10m— 
1) *10n ) 

至 此 ， 便 可 以 得 到 任意 一 个 有 限 小 数 或 无 限 循 环 小 数 的 分 数 表 
示 ， 但 是 此 时 分 母 未 必 是 最 简 的 ， 接 下 来 的 任务 就 是 让 分 母 最 小 ， 即 
对 分 子 和 分 母 进行 约 分 ， 这 个 相对 比较 简单 。 对 于 任意 一 个 分 数 A/B， 
可 以 简化 为 〈A/Gcd (A，B) ) / (B/Gcd (A，B) ) ， 其 中 Gcd 卫 数 
为 求 A 和 B 的 最 大 公约 数 ， 这 就 涉及 本 书 中 的 算法 (2.7 节 “最 大 公约 数 
问题 > ， 其 中 有 很 巧妙 的 解法 ， 请 读者 阅读 具体 的 章节 ， 这 里 就 不 再 

综 上 所 述 ， 先 求 得 小 数 的 分 数 表示 方式 ， 再 对 其 分 子 分 母 进行 约 
分 ， 便 能 够 得 到 分 母 最 小 的 分 数 表现 形式 。 

例如 ， 对 于 小 数 0.3 (33) ， 根 据 上 述 方法 ， 可 以 转化 为 分 数 : 

0.3 (33) 

= (3* (102 一 1) +33) / ( (102 一 1) *10) 


一 (3*99 十 33) /990 

= 

对 于 小 数 0.285714 (285714) ， 我 们 也 可 以 算出 : 
0.285714 (285714) 

(285714* (106 一 1) 十 285714) / ( (106 一 1) *106 ) 
(285714*999999 十 285714) /999999000000 

一 285714/999999 

= 


2.7 最 大 公约 数 问题 


写 一 个 程序 ， 求 两 个 正 整 数 的 最 大 公约 数 。 如 果 两 个 正 整数 都 很 
大 ， 有 什么 简单 的 算法 吗 ? 
分 析 与 解法 

求 最 大 公约 数 是 一 个 很 基本 的 问题 。 早 在 公元 前 300 年 左右 ， 欧 几 
里 得 就 在 他 的 著作 《几何 原本 》 中 给 出 了 高 效 的 解法 一 一 轧 转 相 除 
法 。 轧 转 相 除法 使 用 到 的 原理 很 聪明 也 很 简单 ， 假 设 用 f (x，y) 表示 
x，Jy 的 最 大 公约 数 ， 取 k 二 x/y，b 二 x%y， 则 x 三 ky 十 bp， 如 果 一 个 数 能 
够 同时 整除 x 和 y， 则 必 能 同时 整除 b 和 y; 而 能 够 同时 整除 pb 和 y 的 数 也 
必 能 同时 整除 x 和 y， 即 x 和 y 的 公约 数 与 b 和 y 的 公约 数 是 相同 的 ， 其 最 
大 公约 数 也 是 相同 的 ， 则 有 f (x，y) =f (y, y%x) (yy>0) ， 如 此 
便 可 把 原 问题 转化 为 求 两 个 更 小 数 的 最 大 公约 数 ， 直 到 其 中 一 个 数 为 
0， 剩 下 的 另外 一 个 数 就 是 两 者 最 大 的 公约 数 。 轧 转 相 除法 更 详细 的 证 
明 可 以 在 很 多 的 初等 数论 相关 书籍 中 找到 ， 或 者 读者 也 可 以 试 着 证 明 
一 下 。 

示例 如 下 : 

f (42, 30) =f (30, 12) =f (12, 6) =f (6, 0) =6 


【解法 一 】 
最 简单 的 实现 ， 就 是 直接 用 代码 来 实现 办 转 相 除 法 。 从 上 面 的 描 
述 中 ， 我 们 知道 ， 利 用 递归 就 能 够 很 轻松 地 把 这 个 问题 完成 。 


具体 代码 如 下 : 
int gcdl(int x, int Y) 
{ 
return (!y)?x:gcd(y: x$®%y); 


【解法 二 】 


在 解法 一 中 ， 我 们 用 到 了 取 模 运算 。 但 对 于 大 整数 而 言 ， 取 模 运 
算 (其 中 用 到 除法 ) 是 非常 昂贵 的 开销 ， 将 成 为 整个 算法 的 瓶颈 。 有 
没有 办 法 能 够 不 用 取 模 运算 呢 ? 

采用 类 似 前 面 驾 转 相 除法 的 分 析 ， 如 果 一 个 数 能 够 同时 整除 x 和 
y， 则 必 能 同时 整除 x 一 y 和 y; 而 能 够 同时 整 x 一 y 和 y 的 数 也 必 能 同时 整 
除 x 和 y， 即 x 和 vy 的 公约 数 与 x 一 y 和 vy 的 公约 数 是 相同 的 ， 其 最 大 公约 数 
也 是 相同 的 ， 即 f (x，y) =f (x 一 y，y) ， 那 么 就 可 以 不 再 需要 进行 
大 整数 的 取 模 运算 ， 而 转换 成 简单 得 多 的 大 整数 的 减法 。 

在 实际 操作 中 ， 如 果 x<y， 可 以 先 交 换 (x, y)” (因为 (x, y) 
= (y，x) ) ， 从 而 避免 求 一 个 正 数 和 一 个 负数 的 最 大 公约 数 情况 的 
出 现 。 一 直 迭 代 下 去 ， 直 到 其 中 一 个 数 为 0。 

示例 如 下 : 

f (42, 30) =f (30, 12) =f (12, 18) =f (18, 12) =f (12, 
6) =f (6, 6) =f (6, 0) =6 

解法 二 的 具体 代码 如 下 : 
代码 清单 2-15 


BiglInt x, BigInt y) 


T ps 


代码 中 BigInt 是 读者 自己 实现 的 一 个 大 整数 类 (所 谓 大 整数 当然 可 
以 是 成 百 上 千 位 ) ， 那 么 就 要 求 读者 重 载 该 大 整数 类 中 的 减法 运算 符 
“一 ”， 关 于 大 整数 的 具体 实现 这 里 不 再 袭 述 ， 若 读者 只 是 想 验 证 该 算 
法 的 正确 性 ， 完 全 可 使 用 系统 内 建 的 int 型 来 测试 。 

这 个 算法 ， 免 去 了 大 整数 除法 的 繁琐 ， 但 是 同样 也 有 不 足 之 处 。 
最 大 的 瓶颈 就 是 迭代 的 次 数 比 之 前 的 算法 多 了 不 少 ， 如 果 遇 到 
(10000000000000，1) 这 类 情况 ， 就 会 相当 地 令 人 郁 问 了 。 


【解法 三 】 

解法 一 的 问题 在 于 计算 复杂 的 大 整数 除法 运算 ， 而 解法 二 虽然 将 
大 整数 的 除法 运算 转换 成 了 减法 运算 ， 降 低 了 计算 的 复杂 度 ， 但 它 的 
问题 在 于 减法 的 迭代 次 数 太 多 ， 那 么 能 否 结合 解法 一 和 解法 二 从 而 使 
其 成 为 一 个 最 佳 的 算法 呢 ? 答案 是 肯定 的 。 

首先 从 分 析 公 约 数 的 特点 入 手 : 

对 于 y 和 x 来 说 ， 如 果 y 二 k*y， ，x=k*x; 。 那 么 有 f (y，x) 三 k*f 
(yl ， X1 ) o 

另外 ， 如 果 x 二 p*x; ， 假 设 p 是 素数 ， 并 且 y%p! = 二 0 ( 即 y 不 能 被 p 
整除 ) ， 那 么 f (x, y) =f (p*xl ，y) =f (xi ，y) 。 

注意 到 以 上 两 点 之 后 ， 我 们 就 可 以 利用 这 两 点 对 算法 进行 改进 。 

最 简单 的 方法 是 ， 我 们 知道 ，2 是 一 个 素数 ， 同 时 对 于 二 进 制 表 示 
的 大 整数 而 言 ， 可 以 很 容易 地 将 除 以 2 和 乘 以 2 的 运算 转换 成 移 位 运 
算 ， 从 而 避免 大 整数 除法 ， 由 此 就 可 以 利用 2 这 个 数字 来 进行 分 析 。 

取 p 一 2 

若 x，y 均 为 偶数 ，f (x, y) 三 2*f (x/2, y/2) =2*f (x>>1, y 
>>1) 

若 x 为 偶数 ，y 为 奇数 ，f (x, y) =f (x/2, y) =f (x>>1, y) 

若 x 为 奇数 ，y 为 偶数 ，f (x, y) =f (x, y/2) =f (x, y>>1) 

若 x，y 均 为 奇数 ，f (x, y) =f (x, x 一 y) ， 

那么 在 f (x，y) ==f (x，x 一 y) 之 后 ， (x 一 y) 是 一 个 偶数 ， 下 
一 步 一 定 会 有 除 以 2 的 操作 。 

因此 ， 最 坏 情 况 下 的 时 间 复 杂 度 是 O (log (max (x, y) ) 。 

考虑 如 下 的 情况 : 


f(42,30)=fF(C101010;, 11110;) 
2*f( 10101, 1111;) 
2*f(1111;,110;) 
2*fC1llis112) 
2*f(1100;, 11;) 
2* 丰 (112 112 7) 

中卫 (02 112:》 
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以 和 才 ” 惠 
CN iD No 


根据 上 面 的 规律 ， 具 体 代 码 实现 如 下 : 
代码 清单 2-16 


BigInt gcd(BigInt x, BigInt y) 


BigInt 见 解法 二 中 的 解释 ，IsEven (BigInt x) 图 数 检查 x 是 否 为 偶 
数 ， 如 果 x 为 偶数 ， 则 返回 true， 否 则 返回 false。 

解法 三 很 巧妙 地 利用 移 位 运算 和 减法 运算 ， 避 开 了 大 整数 除法 ， 
提高 了 算法 的 效率 。 程 序 员 常常 将 移 位 运算 作为 一 种 技巧 来 使 用 ， 最 
常见 的 就 是 通过 左 移 或 右 移 来 实现 乘 以 2 或 除 以 2 的 操作 。 其 实 移 位 的 


用 处 远 不 止 于 此 ， 如 求 一 个 整数 的 二 进 制 表 示 中 1 的 个 数 问题 ( 见 本 书 
2.1 节 “ 求 二 进 制 数 中 1 的 个 数 ”) 和 逆转 一 个 整数 的 二 进 制 表示 问题 等 ， 
往往 让 人 拍案 叫绝 。 


2.8” 找 符合 条 件 的 整数 


任意 给 定 一 个 正 整数 N， 求 一 个 最 小 的 正 整 数 M (M >1) ， 使 得 
N*M 的 十 进 制 表示 形式 里 只 含有 1 和 0。 
最 初 的 解法 

看 了 题目 要 求 之 后 ， 我 们 的 第 一 想法 就 是 从 小 到 大 枚 举 M 的 取 
值 ， 然 后 再 计算 N*M， 最 后 判断 它们 的 乘积 是 否 只 含有 1 和 0。 大 体 的 
思路 可 以 用 下 面 的 伪 代 码 来 实现 : 


for(M = 27 ; M++) 
product = N™* 
if (HasOnlyOneAndZero (product)) 
output N,: M, Product, and return; 


但 是 问题 很 快 就 出 现 了 ， 什 么 时 候 应 该 终止 循环 呢 ? 这 个 循环 会 
终止 吗 ? 即使 能 够 终止 ， 也 许 这 个 循环 仍 需 要 耗费 太 多 的 时 间 ， 比 如 N 
二 99 时 ,，M 二 1122334455667789，N*M 二 111111111111111111。 


分 析 与 解法 


题目 中 的 直接 做 法 显然 不 是 一 个 令 人 满意 的 方法 。 还 有 没有 其 他 
的 方法 呢 ? 答案 是 肯定 的 。 

可 以 做 一 个 问题 的 转化 。 由 于 问题 中 要 求 N*M 的 十 进 制 表示 形式 
里 只 含有 1 和 0， 所 以 N*M 与 M 相 比 有 明显 的 特征 。 我 们 不 妨 尝试 去 搜 
索 它 们 的 乘积 N*sM， 这 样 在 某 些 情况 下 需要 搜索 的 空间 要 小 很 多 。 另 
外 ， 搜 索 N*M， 而 不 去 搜索 M， 其 实 有 一 个 更 加 重要 的 原因 ， 就 是 当 
M 很 大 时 ， 特 别 是 当 M 大 于 232 时 ， 某 些 机 器 就 可 能 没 法 表示 M 了 ， 我 
们 就 得 自己 实现 高 精度 大 整数 类 。 但 是 考虑 N*M 的 特点 ， 可 以 只 需要 
存储 N*M 的 十 进 制 表 示 中 “1” 的 位 置 ， 这 样 就 可 以 大 大 缩小 为 表示 N*M 
所 需要 的 空间 ， 从 而 使 程序 能 处 理 数 值 很 大 的 情况 。 因 此 ， 考 虑 到 程 
序 的 推广 性 ， 选 择 了 以 N*M 为 目标 进行 计算 。 


换 句 话说 ， 就 是 把 问题 从 “ 求 一 个 最 小 的 正 整数 M， 使 得 N*M 的 十 
进 制 表 示 形 式 里 只 含有 1 和 0” 变 成 求 一 个 最 小 的 正 整 数 X， 使 得 X 的 十 
进 制 表示 形式 里 只 含有 1 和 0， 并 且 X 被 N 整 除 。 

我 们 先 来 看 一 下 X 的 取 值 ，X 从 小 到 大 有 如 下 的 取 值 : 1、10、 
11、100、101、110、111、1000、1001、1010、1011、1100、1101、 
1110、1111、10000、...... 

如 果 直 接 对 X 进 行 循环 ， 就 是 先 检 查 X= 二 1 是否 可 以 整除 N， 再 检查 
XX 二 10， 然 后 检查 X= 二 11， 接 着 检查 X= 二 100... (就 像 遍 历 二 进 制 整数 一 
样 遍历 X 的 各 个 取 值 )。 但 是 这 样 处 理 还 是 比较 慢 ， 如 果 X 的 最 终结 果 
有 K 位 ， 则 要 循环 搜索 2K 次 。 由 于 我 们 的 目标 是 寻找 最 小 的 XxX， 使 得 X 
mod N= 二 0， 我 们 只 要 记录 mod N= 二 i (0<=i<N) 的 最 小 X 就 可 以 了 。 
这 样 通过 避免 一 些 不 必要 的 循环 ， 可 以 达到 加 速算 法 的 目的 。 那 么 如 
何 避 免 不 必 要 的 循环 呢 ? 先 来 看 一 个 例子 : 

设 N= 二 3，X 二 1， 再 引入 一 个 变量 j，j 二 X%N。 直 接 遍 历 X， 计 算 
中 间 结 果 如 表 2-1 所 示 : 


表 2-1 
Num | | 3 + | 5 € 7 
N 3 3 3 、 
| 10 11 100 101 110 11] 
. ] | | 2 2 0 


表 2-1 计 算 110%3 是 多 余 的 。 原 因 是 1 和 10 对 3 的 余数 相同 ， 所 以 101 
和 110 对 3 的 余数 相同 ， 那 么 只 需要 判断 101 是 否 可 以 整除 3 就 可 以 了 ， 

而 不 用 判断 110 是 否 能 整除 3。 并 且 ， 如 果 X 的 最 低 3 位 是 110， 那 么 可 以 
通过 将 101 蔡 换 110 得 到 一 个 符合 条 件 的 更 小 正 整数 。 因 此 ， 对 于 mod N 
同 余 的 数 ， 只 需要 记录 最 小 的 一 个 。 

有 些 读 者 可 能 会 问 ， 当 X 循 环 到 110 时 ， 我 怎么 知道 1 和 10 对 3 的 余 
数 相同 呢 ? 其 实 ，X= 二 1，X 二 10 是 否 能 整除 3， 在 X 循 环 到 110 时 都 已 经 
计算 过 了 ， 只 要 在 计算 X= 二 1，X= 二 10 时 ， 保留 X%N 的 结果 ， 就 可 以 在 
XX 二 110 时 作出 判断 ， 从 而 避免 计算 X%N。 


以 上 的 例子 阐明 了 在 计算 中 保留 Xx 除 以 N 的 余数 信息 可 以 避免 不 必 
要 的 计算 。 下 面 给 出 更 加 形式 化 的 论述 。 

假设 已 经 遍历 了 X 的 十 进 制 表 示 有 K 位 时 的 所 有 情况 ， 而 且 也 搜索 
了 X= 二 10K 的 情况 ， 设 10K* %N= 二 a。 现 在 要 搜索 X 有 K 十 1 位 的 情况 ， 即 
Xx 二 10K* 十 Y， (0 之 Y<<10K* ) 。 如 果 用 最 简单 的 方法 ， 搜 索 空间 (Y 
的 取 值 ) 将 有 2* 一 1 个 数据 。 但 是 如 果 对 这 个 空间 进行 一 下 分 解 ， 即 把 
Y 按 照 其 对 N 的 余数 分 类 ， 我 们 的 搜索 空间 将 被 分 成 N 一 1 个 子 空间 。 对 
于 每 个 子 空间 ， 其 实 只 需要 判断 其 中 最 小 的 元 素 加 上 10K 是 否 能 被 N 整 
除 即 可 ， 而 没有 必要 判断 这 个 子 空间 里 所 有 元 素 加 上 10K 是 否 能 被 N 整 
除 。 这 样 搜索 的 空间 就 从 2K 一 1 维 压 缩 到 了 N 一 1 维 。 但 是 这 种 压缩 有 
一 个 前 提 ， 就 是 在 前 面 的 计算 中 已 经 保留 了 余数 信息 ， 并 且 把 Y 的 搜索 
空间 进行 了 分 解 。 所 谓 分 解 ， 其 实 ， 从 技术 上 讲 ， 就 是 对 于 “X 模 N?” 的 
各 种 可 能 结果 ， 保 留 一 个 对 应 的 已 经 出 现 了 的 最 小 的 Xx ( 即 建立 一 个 长 
度 为 N 的 “余数 信息 数组 *"， 这 个 数组 的 第 i 位 保留 已 经 出 现 的 最 小 的 模 N 
为 的 X) 。 

那么 现在 的 问题 就 是 如 何 维护 这 个 “余数 信息 数组 * 了 。 假 设 已 经 
有 了 X 的 十 进 制 表 示 有 K 位 时 的 所 有 余数 信息 。 也 有 了 X=10K 的 余数 信 
息 。 现 在 我 们 要 搜索 X 有 K 十 1 位 的 情况 ， 也 即 X=10K* 十 Y， (0<Y< 
10K ) 时 ，X 除 以 N 的 余数 情况 。 由 于 已 经 有 了 对 Y 的 按 除 N 的 余数 进行 
的 空间 分 解 情况 ， 即 Y 之 10* 的 余数 信息 数组 。 我 们 只 需要 将 10* %N 
的 结果 与 余数 信息 数组 里 非 空 的 元 素 相 加 ， 再 去 模 N， 看 看 会 不 会 出 现 
新 的 余数 即 可 。 如 果 出 现 ， 就 在 余数 信息 数组 的 相应 位 置 增添 对 应 的 
X。 这 一 步 只 需要 N 次 循环 。 

综 上 所 述 ， 假 设 最 终 的 结果 X 有 K 位 ， 那 么 直接 遍历 X， 需 要 循环 
2K 次 ， 而 按照 我 们 保留 余数 信息 避免 不 必要 的 循环 的 方法 ， 最 多 只 需 
要 (K 一 1) *N 步 。 可 以 看 出 ， 当 最 终结 果 比 较 大 时 ， 保 留 余数 信息 的 
算法 具有 明显 的 优势 。 

下 面 是 这 个 算法 的 伪 代 码 : BigInt[i] 表 示 模 N 等 于 i 的 十 进 制 表 示 形 
式 里 只 含 1 和 0 的 最 小 整数 。 由 于 BigInt[i] 可 能 很 大 ， 又 因为 它 只 有 0 和 
1， 所 以 ， 只 需要 记 下 1 的 位 置 即 可 。 上 比如 ， 整 数 1001， 记 为 (0，3) 


三 10 十 103 。 即 BigInt 的 每 个 元 素 是 一 个 变 长 数组 ， 对 于 模 N 等 于 i 的 最 
小 X，BigInt 的 每 个 元 素 将 存储 最 小 X 在 十 进 制 中 表示 “1 的 位 置 。 我 们 
的 目标 就 是 求 BigInt[0]。 

代码 清单 2-17 


// 初始 化 
for(I = 0; i < N; 1i++) 
BigInt [i] .clear(); 
BigInt [1] .push_back (0); 


for(l4 = 1 3 = 10 SN 7ittrr = (3 10 $° HN) 
{ 
int NoUpdate = 0; 
bool flag = false; 
if (BigIint [3] .size() == 0) 
{ 
大 BIGINCAEI] 0° CEUF1 Ns 
BigInt [3j] .clear(); 
BigInt [3] .push_back (i); 
} 
for(x = 1; < N 大 + 二) 
{ 
if((BigInt[k] .size() > 0) 
&& (i > BigIint [k] [BigInt [Kk] .size{() 一 1]) 


sa (BigInt[(k + j) $$ N] .size() == 0)) 
( 
// BigInt[(k + j) % N] = 10*i + BigInt{(k] 
flag = true; 
BigInt[(k + j) % NI = BigInt [k]; 


BigIint[(k + 3) $% N] .push_back (i); 
} 
} 
if (flaq == false) 
NoUpdate++; 
// 如 果 经 过 一 个 循环 节 都 没 能 对 BigInt 进 行 更 新 ， 就 是 无 解 ， 跳 出 ， 
// 或 者 BigInt [0] != NULL， 已 经 找到 解 ， 也 跳出 。 


if(NoUpdate == N || BigInt [0] .size() > 0) 
break; 
} 
if (BigInt [0] .size() == 0) 


{ 
// M not exist 
} 
else 
{ 
// Find N * M = BigInt[0] 
} 


在 上 面 的 实现 中 ， 循 环节 取 值 N (其 实 循环 节 小 于 等 于 N， 循 环节 
就 是 最 小 的 c， 使 得 10cmodN=1) 。 
这 个 算法 其 实 部 分 借鉴 了 动态 规划 算法 的 思想 。 在 动态 规划 算法 


的 经 典 实例 “最 短路 径 问 题 " 中 ， 当 处 理 中 间 结 点 时 ， 只 需要 得 到 从 起 
点 到 中 间 结 点 的 最 短路 径 ， 而 不 需要 中 间 结 点 到 那个 端点 的 所 有 路 径 


信息 。“ 只 保留 模 N 的 结果 相同 的 X 中 最 小 的 一 个 ”的 方法 ,与 此 思路 相 
似 。 
扩展 问题 


1. 对 于 任意 的 N， 一 定 存 在 M， 使 得 N*M 的 乘积 的 十 进 制 表 示 只 
是 
， 怎样 找 出 满足 题目 要 求 的 N 和 M， 使 得 Nx*sM<216 ， 且 N 十 M 最 
有 


2.9 ” 斐 波 那 契 (Fibonacci) 数列 


辈 波 那 契 数列 是 一 个 非 党 美丽 、 和 谐 的 数列 ， 有 人 说 它 起 源 于 一 
对 繁殖 力 怀 人 、 基 因 非 党 优秀 的 锡 子 ， 也 有 人 说 远古 时 期 的 婴 吏 螺 就 
知道 这 个 规律 。 

这 个 数列 可 以 用 排 成 螺旋 状 的 一 系列 正方 形 来 形象 地 说 明 。 刚 开 
台 ， 我 们 把 两 个 边 长 为 1 的 正方 形 排列 在 一 起 (如 图 2-2 所 示 ) : 


图 2-2 


然后 我 们 依次 在 图 形 中 边 长 较 长 的 一 边 接 上 一 个 新 的 正方 形 (如 
图 2-3、 图 2-4 所 示 ) : 


图 2-3 


图 2-4 


按 此 顺序 依次 累加 ， 并 在 新 的 正方 形 中 加 入 以 边 长 为 半径 的 圆 
弧 ， 我 们 就 会 得 到 美丽 的 曲线 。 
每 一 个 学 理工 科 的 学 生 都 知道 斐 波 那 契 数列 ， 斐 疲 那 契 数列 由 如 
下 递 推 关 系 式 定 义 : 
0 if n= 0; 
中 | 总 /区 一 亲民 


F(n—-1)+F(n—2)ifn>1 


每 一 个 上 过 算法 课 的 同学 都 能 用 递归 的 方法 求解 斐 波 那 契 数列 的 
第 n 十 1 项 的 值 ， 即 F (n) 。 
代码 清单 2-18 


工 工 《了 


我 们 的 问题 是 : 有 没有 更 加 优化 的 解法 ? 
分 析 与 解法 

技术 面试 的 一 个 常见 问题 是 ， 对 于 一 个 常见 的 算法 ， 能 否 进一步 
优化 ? 这 个 时 候 ， 平 时 喜欢 超越 课本 思考 问题 的 同学 ， 就 有 施展 才华 
的 机 会 了 。 
【解法 一 】 递 推 关 系 式 的 优化 


上 面 一 页 写 出 的 算法 是 根据 递 推 关 系 式 的 定义 直接 得 出 的 ， 它 在 
计算 F[n] 时 ， 需 要 计算 从 F[2] 到 F[n 一 1] 每 一 项 的 值 ， 这 样 简单 的 递归 式 
存在 着 很 多 的 重复 计算 ， 如 求 FI5]=F[4] 十 F[3]， 在 求 F[4] 的 时 候 也 需 
要 求 一 次 F[3] 的 大 小 ， 等 等 。 请 问 这 个 算法 的 时 间 复 杂 度 是 多 少 ? 

那么 如 何 减少 这 样 的 重复 计算 呢 ? 可 以 用 一 个 数组 储存 所 有 已 计 
算 过 的 项 。 这 样 便 可 以 达到 用 空间 换取 时 间 的 目的 。 在 这 种 情况 下 ， 
时 间 复 杂 度 为 O(N) ， 而 空间 复杂 度 也 为 O (N) 。 

那么 有 更 快 的 算法 吗 ? 


【解法 二 】 求解 通 项 公式 


如 果 我 们 知道 一 个 数列 的 通 项 公式 ， 使 用 公式 来 计算 会 更 加 容 
易 。 能 不 能 把 这 个 函数 的 递 推 公式 计算 出 来 ? 
由 弟 推 公式 F Cn) =F (n 一 1) 十 F 一 2) ， 知 道 F (n) 的 特征 
se 
2 二 x 十 1 
有 根 : Xi ,= : 


所 以 存在 A，B 使 得 : 
| rp 


ry 


F(n)=Ax 


Le 


代入 F (0) ==0, F (1) =1, 解 得 4 = y5 pl 


村 


通过 公式 ， 我 们 可 以 在 O (1) 的 时 间 内 得 到 F (n) 。 但 公式 中 引 
入 了 无 理 关 ? 所 以 不 和 E 保 证 结果 的 精 让 


【解法 三 】 分 治 策略 
注意 到 Fibonacci 数 列 是 二 阶 递 推 数列 ， 所 以 存在 一 个 2*2 的 和 矩阵 
A， 使 得 : 
(BE EJ=(E, Eja & hb 
-| | 
由 (1) 式 我 们 有 : 
ER Bonets Tua sel HA 
剩 下 的 问题 就 是 求解 矩阵 A 的 方 究 。 


BF(n)= 


A, 二 A*A*...*A。 最 直接 的 解法 就 是 通过 n 一 1 次 乘法 得 到 结果 。 
但 是 当 n 很 大 时 ， 比 如 1000000 或 1000000000， 这 个 算法 的 效率 就 不 能 
接受 了 。 当 然 ， 你 马上 会 说 ， 在 这 个 情况 下 ，F, 在 整数 里 早 就 溢出 
了 ， 但 如 果 需 要 求解 的 是 F, 对 某 个 素数 的 余数 呢 ? 这 个 算法 会 是 非常 
有 用 和 高 效 的 。 

我 们 注意 到 |: 

Axty ALRAY: 

Ax*2 一 Ax+x 一 (Ax) 2 

用 二 进 制 方式 表示 nm: 

n 一 al *2k 十 a._1 *2k 1 十 ... 十 ai *2 十 a。 (其 中 a =0 或 1, i=0， 
Ee 

A" = A rt (A (A .A fA 

如 果 能 够 得 到 才 2 (i=1，2，...，k) 的 值 ， 就 可 以 再 经 过 log, n 
次 乘法 得 到 An 。 


A 二 由 ) 

举 个 例子 : 
的 过 本 十 本 2 一 4 | 
求解 : 4 = 4 


4: = (4 } 
A* =(4*) 
具体 的 代码 如 下 : 


代码 清单 2-19 


ph 24E 


Class Matrix; // 假设 我 们 已 经 有 了 实现 乘法 操作 的 矩阵 类 
// 求解 m 的 n 次 方 


i Me ny mn 二 n 
nst Matrix&k mr int n 


Matrix MatrixPow (co 
| 
Matrix result = Matrix::Identity; /7 赋 初 值 为 单位 知 阵 
Matrix tmp = m; 


for(; n; n >>= 1) 


result *= tmp; 


int Fibonaccit{int n) 


{ 
A 的 值 就 是 上 面 求 解 出 来 的 


= MatrixPow (A 
7 返回 Fn 


0) + FO * an(tl, 0)7 


Matrix an 


return Fi* anf(0， 


整个 算法 的 时 间 复 杂 度 是 O(log, n) 。 
扩展 问题 


段 设 A (0) =1, A (1) =2，A (2) 
(k) =A (k—1) +A (k—2) +A (k—3) 。 

1. 对 于 任何 一 个 给 定 的 n"， 如 何 计算 出 A (n) ? 

2. 对 于 n 非 常 大 的 情况 ， 如 n= 二 260 的 时 候 ， 如 何 计算 A Cn) 呢 ? 


一 2。 对 于 n>2， 都 有 A 


2.10 “寻找 数组 中 的 最 大 值 和 最 小 值 


数组 是 最 简单 的 一 种 数据 结构 。 我 们 经 常 碰 到 的 一 个 基本 问题 ， 
就 是 寻找 整个 数组 中 最 大 的 数 ， 或 者 最 小 的 数 。 这 时 ， 我 们 都 会 扫描 
一 遍 数 组 ， 把 最 大 (最 小 ) 的 数 找 出 来 。 如 果 我 们 需要 同时 找 出 最 大 
和 最 小 的 数 呢 ? 

对 于 一 个 由 N 个 整数 组 成 的 数组 ， 需 要 比较 多 少 次 才能 把 最 大 和 最 
小 的 数 找 出 来 呢 ? 

分 析 与 解法 
【解法 一 】 

可 以 把 寻找 数组 中 的 最 大 值 和 最 小 值 看 成 是 两 个 独立 的 问题 ， 我 
们 只 要 分 别 求 出 数组 的 最 大 值 和 最 小 值 即 可 解决 问题 。 最 直接 的 做 法 
是 先 扫 描 一 遍 数 组 ， 找 出 最 大 的 数 以 及 最 小 的 数 。 这 样 ， 我 们 需要 比 
较 2*N 次 才能 找 出 最 大 的 数 和 最 小 的 数 。 

能 否 在 这 两 个 看 似 独立 的 问题 之 间 建 立 关 联 ， 从 而 减少 比较 的 次 
数 呢 ? 

【解法 二 】 

一 般 情况 下 ， 最 大 的 数 和 最 小 的 数 不 会 是 同一 个 数 (除非 N=1， 
或 者 所 有 整数 都 是 一 样 的 大 小 ) 。 所 以 ， 我 们 希望 先 把 数组 分 成 两 部 
分 ， 然 后 再 从 这 两 部 分 中 分 别 找 出 最 大 的 数 和 最 小 的 数 。 

首先 按 顺 序 将 数组 中 相 邻 的 两 个 数 分 在 同一 组 (这 只 是 概念 上 的 
分 组 ， 无 须 做 任何 实际 操作 ) 。 若 数组 为 {5，6，8，3，7，9} (如 图 2- 
5 所 示 ) : 


图 2-5 “数组 示意 图 


接着 比较 同一 组 中 奇数 位 数字 和 偶数 位 数字 ， 将 较 大 的 数 放 在 偶 
数位 上 ， 较 小 的 数 放 在 奇数 位 上 。 经 过 N/2 次 比较 的 预 处 理 后 ， 较 大 的 
数 都 放 到 了 偶数 位 置 上 ， 较 小 的 数 则 放 到 了 奇数 位 置 上 ， 如 图 2-6 所 
示 : 


图 2-6 


最 后 ， 我 们 从 奇偶 数位 上 分 别 求 出 Max 二 9，Min 二 3， 各 需要 比较 
N/2 次 。 整 个 算法 共 需 要 比较 1.5*N 次 。 
[解法 三 】 

解法 二 已 经 将 比较 次 数 降低 到 了 1.5*N 次 ， 但 它 破坏 了 原 数组 ， 如 
何 能 够 不 破坏 原 数 组 呢 ? 解法 二 是 事先 将 两 两 分 组 中 较 小 和 较 大 的 数 
调整 了 顺序 ， 从 而 破坏 了 数组 ， 如 果 可 以 在 遍历 的 过 程 中 进行 比较 ， 
而 不 需要 对 数组 中 的 元 素 进 行 调换 ， 就 可 以 不 用 破坏 原 数组 了 。 首 先 
仍然 按 顺序 将 数组 中 相 邻 的 两 个 数 分 在 同一 组 《这 只 是 概念 上 的 分 
组 ， 无 须 做 任何 实际 操作 ) 。 然 后 可 以 利用 两 个 变量 Max 和 Min 来 存储 
当前 的 最 大 值 和 最 小 值 。 同 一 组 的 两 个 数 比较 之 后 ， 不 再 调整 顺序 ， 
而 是 将 其 中 较 小 的 数 与 当前 Min 作 比较 ， 如 果 该 数 小 于 当前 Min 则 更 新 
Min。 同 理 ， 将 其 中 较 大 的 数 与 当前 Max 作 比较 ， 如 果 该 数 大 于 当前 
Max， 则 更 新 Max。 如 此 反复 比较 ， 直 到 遍历 完整 个 数组 。Min 和 Max 
分 别 被 初始 化 为 数组 第 一 和 第 二 个 数 中 的 小 者 和 大 者 。 仍 设 原 数组 为 
{5，6，8，3，7，9}， 则 Min 和 Max 分 别 被 初始 化 为 6 和 5。 比较 过 程 如 
图 2-7 所 示 : 


Max=6 Min=5 


区 


Max=8 Min=3 


6 ] -i | 3 ] 9 | 7 
Max=9 Min=3 
ss |alée ls | ] 7 
图 2-7 查找 比较 示意 图 


最 后 ，Max 二 9，Min 二 3。 但 是 时 间 复 杂 度 并 未 降低 ， 整 个 过 程 的 

比较 次 数 仍 为 1.5*N 次 。 
【解法 四 】 

分 治 思 想 是 算法 中 很 常用 的 一 种 技巧 。 在 N 个 数 中 求 最 小 值 Min 和 
最 大 值 Max， 我 们 只 须 分 别 求 出 前 后 N/2 个 数 的 Min 和 Max， 然 后 取 较 小 \ 
的 Min， 较 大 的 Max 即 可 (只 须 较 大 的 数 和 较 大 的 数 比较 ， 较 小 的 数 和 
较 小 的 数 比 较 ， 两 次 就 可 以 了 ) 。 

假设 我 们 要 求 arr[1，2，.……，nm] 数 组 的 最 大 数 和 最 小 数 ， 上 述 算法 
的 伪 代 码 则 为 : 
代码 清单 2-20 


(max, min} Search (arr, b, e) 


{ 


if{le 一 Pb <= 1) 
{ 
if(arr[b] < arr[el) 
return (arrle], arr[b})); 
else 
return (arr[bl], arrlel]); 
} 
(maxbL, minL) = Search{arr, b, b+ (e—- b) / 2); 
(maxR, minR) = Search(arr, b+ {e b}) /2+ 1 @); 
if (maxL > maxR) 
maxV = maxL; 
else 
maxyV maxR; 
if (minL < minR) 
minV = minL; 
else 
minV = minR; 
return (maxV, minV); 


如 果 用 f (N) 表示 这 个 算法 对 于 N 个 数 的 情况 需要 比较 的 次 数 。 


们 可 以 得 到 : 


/(2)=1 

f(N)=2*f(N/2)+2 
=2 *(2* f(N/27)+2)+2 
=2*f(N/27:)+2: +2 


=2mu i (ON120em31) 二 2xmx3 二 .十 2 


2)+20e2 十 .十 23 十 2 


N a at, 
— 不 (21 生 二 ~ 
f (2) 本 


N 
> 0 


十 一 
2 下 六 


-1.5N -2 - 
所 以 说 即使 采用 分 治 法 ， 总 的 比较 次 数 仍然 没有 减少 。 


扩展 问题 


如 果 需 要 找 出 N 个 数组 中 的 第 二 大 数 ， 需 要 比较 多 少 次 呢 ? 是 否 昌 
以 使 用 类 似 的 分 冶 思想 来 降低 比较 的 次 数 呢 ? 


2.11 “寻找 最 近 点 对 


给 定 平面 上 N 个 点 的 坐标 ， 找 出 距离 最 近 的 两 个 点 《如 图 2-8 所 
示 ) 。 


图 2-8 七 个 平面 上 的 点 


分 析 与 解法 


初 看 这 个 问题 ， 会 觉得 不 太 容易 解答 ， 没 有 什么 头绪 ， 在 面试 的 
时 候 ， 怎 么 办 ? 我 们 不 妨 先 看 看 一 维 的 情况 : 在 一 个 包含 N 个 数 的 数组 
中 ， 如 何 快速 找 出 N 个 数 中 两 两 差 值 的 最 小 值 ? 一 维 的 情况 相当 于 所 有 
的 点 都 在 一 条 直线 上 。 虽 然 是 一 个 退化 的 情况 ， 但 还 是 能 从 中 得 到 一 
些 启发 。 


【解法 一 】 


数组 中 总 共 包含 N 个 数 ， 我 们 把 它们 两 两 之 间 的 差 值 都 求 出 来 ， 那 
样 就 不 难得 出 最 小 的 差 值 了 。 这 样 一 个 直接 的 想法 ， 时 间 复 杂 度 为 O 
(N? ) 。 伪 代码 如 下 : 
代码 清单 2-21 


如 果 扩 展 到 二 维 的 情况 ， 那 就 相当 于 枚 举 任意 两 个 点 ， 然 后 再 记 
录 下 距离 最 近 的 点 对 。 时 间 复 杂 度 也 是 O 〈N“* ) 。 这 还 是 一 个 很 直接 
的 想法 ， 能 否 继续 改进 呢 ? 
【解法 二 】 

如 果 数 组 有 序 ， 找 出 最 小 的 差 值 就 很 容易 了 。 可 以 用 O (N*log， 
N) 的 算法 进行 排序 (快速 排序 、 堆 排序 、 归 并 排序 等 ) 。 排 序 完成 
后 ， 找 最 小 差 值 只 需要 O (N) 的 时 间 ， 总 时 间 复 杂 度 是 O(N*log， 
N) 。 
代码 清单 2-22 


在 一 维 情况 下 ， 时 间 复 杂 度 改进 了 不 少 。 但 是 这 个 方法 不 能 推广 
到 二 维 的 情况 ， 因 为 距离 最 近 的 点 对 不 能 保证 是 映射 到 某 条 直线 之 后 
紧 靠 着 的 两 个 点 。 如 图 2-9 所 示 ， 点 A 和 C 的 距离 最 近 ， 但 它们 在 X 轴 上 
的 投影 点 却 不 是 相 邻 的 。 


图 2-9 ”二 维 投影 示意 图 


【解法 三 】 


还 有 什么 想法 呢 ? 如 果 我 们 用 数组 的 中 间 值 k 把 数组 分 成 Left、 
Right 两 部 分 ， 小 于 k 的 数 为 Left 部 分 ， 其 他 的 为 Right 部 分 ， 那 么 这 个 最 
小 差 值 要 么 来 自 Left 部 分 ， 要 么 来 自 Right 部 分 ， 要 么 是 Left 中 最 大 数 和 
Right 中 最 小 数 的 差 值 。 在 这 里 ， 我 们 其 实 借用 了 分 治 思 想 。 时 间 复 杂 
度 仍然 为 O (N*log, N) 。 

这 个 方法 中 的 分 治 思想 也 可 以 扩展 到 二 维 的 情况 : 

根据 水 平方 向 的 坐标 把 平面 上 的 N 个 点 分 成 两 部 分 Left 和 Right。 跟 
以 往 一 样 ， 我 们 希望 这 两 个 部 分 点 数 的 个 数 差 不 多 。 假 设 分 别 求 出 了 
Left 和 Right 两 个 部 分 中 距离 最 近 的 点 对 之 最 短 距离 为 MinDist (Left) 
和 MinDist (Right) ， 还 有 一 种 情况 我 们 没有 考虑 ， 那 就 是 点 对 中 一 个 
点 来 自 于 Left 部 分 ， 另 一 个 点 来 自 于 Right 部 分 。 最 直接 的 想法 ， 那 就 
是 穷 举 Left 和 Right 两 个 部 分 之 间 的 点 对 ， 这 样 的 点 对 很 多 ， 最 多 可 能 
有 N*N/4 对 。 显 然 ， 穷 举 所 有 Left 和 Right 之 间 的 点 对 是 不 好 的 做 法 。 是 
否 可 以 只 考虑 有 可 能 成 为 最 近 点 对 的 候选 点 对 呢 ? 由 于 我 们 已 经 知道 
Left 和 Right 两 个 部 分 中 的 最 近 点 对 距离 分 别 为 MinDist (Left) 和 
MinDist (Right) ， 如 果 Left 和 Right 之 间 的 点 对 距离 超过 MDist 二 
MinValue (MinDist (Left) ，MinDist (Right) ) ， 我 们 则 对 它们 并 不 
感 兴趣 ， 因 为 这 些 点 对 不 可 能 是 最 近 点 对 。 


MDist MDist 


X=M 
图 2-10 ”二 维 点 分 布 示 意图 


如 图 2-10 所 示 ， 通 过 直线 x 二 M 将 所 有 的 点 分 成 <M 和 x>>M 两 部 
分 ， 在 分 别 求 出 两 部 分 的 最 近 点 对 之 后 ， 只 需要 考虑 点 对 CD。 因 为 其 
他 点 对 AD、BD、CE、CF、CG 等 都 不 可 能 成 为 最 近 点 对 。 也 就 是 说 ， 
只 要 考虑 从 x 二 M 一 Mdist 到 x 三 M 十 MDist 之 间 这 个 带 状 区 域内 的 最 小 点 
对 ， 然 后 再 跟 MDist 比 较 就 可 以 了 。 在 计算 带 状 区 域 的 最 小 点 对 时 ， 可 
以 按 Y 坐 标 ， 对 带 状 区 域内 的 顶点 进行 排序 。 如 果 一 个 点 对 的 距离 小 于 
MDist， 那 么 它们 一 定 在 一 个 MDist* (2*Mdist) 的 区 域内 (如 图 2-11 所 
示 ) : 


MDist MDist 


-< Ca La 
图 2-11 区域 示意 图 


而 在 左右 两 个 Mdist*+MDist 正 方形 区 域内 ， 最 多 都 只 能 含有 4 个 
点 。 如 果 超 过 4 个 点 ， 则 这 个 正方 形 区 域内 至 少 存在 一 个 点 对 的 距离 小 
于 Mdist， 这 跟 x<M 和 x>>M 两 个 部 分 的 最 近 点 对 距离 分 别 是 MinDist 
(Left) 和 MinDist (Right) 矛盾 。 


MDist 


MDist © MDist 


-二 和 和 
图 2-12 ”区 域 示意 图 


因此 ， 一 个 MDist* (2*Mdist) 的 区 域内 最 多 有 8 个 点 (如 图 2-12 所 
示 ) 。 对 于 任意 一 个 带 状 区 域内 的 顶点 ， 只 要 考察 它 与 按 Y 坐 标 排序 且 
紧 接着 的 7 个 点 之 间 的 距离 就 可 以 了 。 根 据 这 个 特点 ， 我 们 可 用 O 

(N) 时 间 完 成 带 状 区 域 最 近 点 对 的 查找 。 在 这 一 步 ， 需 要 注意 的 是 : 


我 们 可 以 用 归并 排序 法 将 带 状 区 域 的 点 按 Y 坐 标 排序 。 归 并 排序 的 过 程 
与 计算 最 近 点 对 的 算法 结合 在 一 起 。 

整个 算法 的 时 间 复 杂 度 f (N) 的 递归 表达 式 为 : 

F (2) =1 

F (3) =3 

F (N) =2*f (N/2) 十 O (N) (N>2) 

可 以 计算 出 f (N) ==N*log, N。 也 就 是 说 ,我们 用 O (N*log, N) 
的 时 间 可 以 完成 最 近 点 对 问题 。 
扩展 问题 


1. 如 果 给 定 一 个 数组 arr[0，...，N 一 1]， 要 求 找 出 相 邻 两 个 数 的 
最 大 差 值 。 对 于 数 X 和 Y， 如 果 不 存在 其 他 数组 中 的 数 在 [X，Y] 区 间 ] 

内 ， 则 我 们 称 X 和 Y 是 相 邻 的 。 

我 们 也 可 以 使 用 上 面 的 方法 来 解决 这 个 扩展 问题 。 不 过 ， 这 个 扩 
展 问题 还 有 一 个 更 漂亮 的 解法 。 如 果 在 这 个 数组 arr 中 ， 最 大 的 数 为 
arrMaxValue， 而 最 小 的 数 为 arrMinValue， 那 么 根据 抽 居 原理 ， 相 邻 两 
个 数 的 最 大 差 值 一 定 不 小 于 delta= (arrMaxValue 一 arr.MinValue) / (N 
Sg 

证 明 : 假设 任意 相 邻 两 个 数 的 差 值 都 小 于 delta， 而 数组 arr 从 小 到 
大 排 好 序 后 得 到 数组 sorted_arr，sorted_arr[0]<sorted_arr[1]< .< 
sorted_arr[N 一 1]， 则 sorted_arr[1] 一 sorted_arr[0]< delta，sorted_arr[2] 一 
sorted_arr[1]<delta, ..., sorted_arr[N—1]—sorted_arr[N—2]< delta， 

有 arrMaxValue 一 arr.MinValue 三 sorted_arr[N 一 1] 一 Sorted_arr[0] 二 

(sorted_arr[N—1]—sorted_arr[N—2]) 十 ... 十 (sorted_arr[1] 一 
sorted_arr[0]) <delta* (N 一 1 三 arrMaxValue 一 arrMinValue。 那 么 它 
与 假设 矛盾 。 

通过 上 面 的 分 析 ， 我 们 知道 最 大 的 差 值 大 于 等 于 delta。 因 此 ， 我 
们 忽略 小 于 delta 的 差 值 ， 因 为 这 些 差 值 都 不 可 能 是 答案 。 一 个 方法 就 
是 我 们 把 区 间 [arr.MinValue，arr.MaxValue] 分 成 N 个 桶 : [arrMinValue， 
arr.MinValue]，[arr.MinValue 十 deltal]，[arrMinValue 十 delta， 


arr.MinValue 十 deltar2]，...，[arrMaxValue 一 delta，arr.MaxValue]。 综 
合 上 面 的 分 析 ， 我 们 知道 最 大 的 差 值 应 该 出 现在 不 同 的 桶 之 间 (除非 
delta 二 0) ， 因 为 处 于 同一 个 桶 的 两 个 数 的 差 值 不 超过 delta， 我 们 可 以 
忽略 不 计 。 既 然 最 大 的 差 值 处 于 两 个 不 同 的 桶 之 间 ， 那 么 它们 就 等 于 
某 个 桶 的 最 小 值 与 前 一 个 非 空 桶 的 最 大 值 的 差 值 。 

根据 上 面 的 分 析 ， 可 以 申请 O (N) 大 小 的 空间 来 存储 每 一 个 桶 的 
最 大 值 和 最 小 值 ， 然 后 再 扫描 一 遍 所 有 的 桶 就 可 以 得 到 整个 数组 的 最 
大 差 值 。 整 个 算法 的 空间 复杂 度 和 时 间 复 杂 度 均 为 O (N) 。 

2. 如 果 给 定 的 是 平面 上 的 N 个 点 ， 如 何 寻 找 距 离 最 远 的 两 个 点 
呢 ? 


2.12 ”快速 寻找 满足 条 件 的 两 个 数 


能 否 快速 找 出 一 个 数组 中 的 两 个 数字 ， 让 这 两 个 数字 之 和 等 于 一 
个 给 定 的 数字 ， 为 了 简化 起 见 ， 我 们 假设 这 个 数组 中 肯定 存在 这 样 一 
组 或 以 上 符合 要 求 的 解 。 

分 析 与 解法 

这 个 题目 不 是 很 难 ， 也 很 容易 理解 。 但 是 要 得 出 高 效率 的 解法 ， 
还 是 需要 一 番 思 考 的 。 

[解法 一 】 

刚 看 到 这 个 题目 ， 很 容易 想到 的 解法 就 是 穷 举 : 从 数组 中 任意 取 
出 两 个 数字 ， 计 算 两 者 之 和 是 否 为 给 定 的 数字 。 

显然 其 时 间 复 杂 度 为 N (N 一 1) /2 即 O (N2 ) 。 这 个 算法 很 简单 ， 
写 起 来 也 很 容易 ， 但 是 效率 不 高 。 一 般 在 程序 设计 里 面 ， 要 尽 可 能 降 
低 算 法 的 时 间 和 空间 复杂 度 ， 所 以 需要 继续 寻找 效率 更 高 的 解法 。 
【解法 二 】 

求 两 个 数字 之 和 ， 假 设 给 定 的 和 为 Sum。 一 个 变通 的 思路 ， 就 是 对 
数组 中 的 每 个 数字 arr[i 都 判别 Sum 一 arr[ 订 是 否 在 数组 中 。 这 样 ， 就 变 
通 成 为 一 个 查找 的 算法 。 

在 一 个 无 序数 组 中 查找 一 个 数 的 复杂 度 是 O(N) ， 对 于 每 个 数字 
ar[i]， 都 需要 查找 对 应 的 Sum-arr[i] 在 不 在 数组 中 ， 很 容易 得 到 时 间 复 
杂 度 还 是 O(N? ) 。 这 和 最 原始 的 方法 相 比 没有 改进 。 但 是 如 果 能 
提高 查找 的 效率 ， 就 能 够 提高 整个 算法 的 效率 。 怎 样 提 高 查找 的 效率 
呢 ? 

学 过 编程 的 人 都 知道 ， 提 高 查找 效率 通常 可 以 先 将 要 查找 的 数组 
排序 ， 然 后 用 二 分 查找 等 方法 进行 查找 ， 就 可 以 将 原来 O(N) 的 查找 
时 间 ] 缩 短 到 O (log, N) 。 这 样 对 于 每 个 arr[i]， 都 要 花 O (log, N) 去 查 


找 对 应 的 Sum 一 arr[ 在 不 在 数组 中 ， 总 的 时 间 复 杂 度 降低 为 Nlog, N。 
当然 将 长 度 为 N 的 数组 进行 排序 本 身 也 需要 O (Nlog, N) 的 时 间 ， 好 在 
只 需要 排序 一 次 就 够 了 ， 所 以 总 的 时 间 复 杂 度 依然 是 O (Nlog, N) 。 
这 样 ， 就 改进 了 最 原始 的 方法 。 

到 这 里 ， 有 的 读者 可 能 会 更 进一步 地 想 ， 先 排序 再 二 分 查找 固然 
可 以 将 时 间 从 O (N?* ) 缩短 到 O (log, N) ， 但 是 还 有 更 快 的 查找 方 
法 : hash 表 。 因 为 给 定 一 个 数字 ， 根 据 hash 映 射 查找 另 一 个 数字 是 否 在 
数组 中 ， 只 需 用 O (1) 时 间 。 这 样 的 话 ， 总 体 的 算法 复杂 度 可 以 降低 
到 O (N) ， 但 这 种 方法 需要 额外 增加 O (N) 的 hash 表 存储 空间 。 在 有 
的 情况 下 ， 用 空间 换 时 间 也 并 不 失 为 一 个 好 方法 。 
【解法 三 】 

还 可 以 换个 角度 来 考虑 这 个 问题 ， 假 设 已 经 有 了 这 个 数组 的 任意 
两 个 元 素 之 和 的 有 序数 组 〈 长 为 N* ) 。 那 么 利用 二 分 查找 法 ， 只 需 用 
O (2log, N) 就 可 以 解决 这 个 问题 。 当 然 不 太 可 能 去 计算 这 个 有 序数 
组 ， 因 为 它 需要 O (N? ) 的 时 间 。 但 这 个 思考 仍 启 发 我 们 ， 可 以 直接 
对 两 个 数字 的 和 进行 一 个 有 序 的 遍历 ， 从 而 降低 算法 的 时 间 复 杂 度 。 

首先 对 数组 进行 排序 ， 时 间 复 杂 度 为 〈(Nlog N) 。 

然后 首先 令 i 王 0，j=n 一 1， 看 arr[i 十 arr[j] 是 否 等 于 Sum， 如 果 
是 ， 则 结束 。 如 果 小 于 Sum， 则 i=i 十 1; 如 果 大 于 Sum， 则 j=j 一 1。 这 
样 只 需要 在 排 好 序 的 数组 上 遍历 一 次 ， 就 可 以 得 到 最 后 的 结果 ， 时 间 
复杂 度 为 O0 (N) 。 两 步 加 起 来 总 的 时 间 复 杂 度 O (Nlog, N) ， 下 面 这 
个 程序 就 利用 了 这 个 思想 。 
代码 清单 2 一 23 伪 代码 


f 1 
LOI (J 3 
f (arr | 


它 的 时 间 复 杂 度 是 O (N) 。 
扩展 问题 


注意 我 们 题目 有 一 个 重要 的 前 提 ， 就 是 数组 中 肯定 存在 这 样 的 一 
对 数字 。 考 虑 下 面 的 扩展 问题 : 

1. 如 果 把 这 个 问题 中 的 “两 个 数字 ” 改 成 “三 个 数字 ”或 “任意 个 数 
字 ” 时 ， 你 的 解 是 什么 呢 ? 

2. 如 果 完 全 相等 的 一 对 数字 对 找 不 到 ， 能 否 找 出 和 最 接近 的 解 ? 

3. 把 上 面 的 两 个 题目 综合 起 来 ， 就 得 到 这 样 一 个 题目 : 给 定 一 个 
数 N， 和 一 组 数字 集合 S， 求 中 和 最 接近 N 的 子 集 。 想 继续 钻研 下 去 的 
读者 ， 可 以 看 一 看 专业 书籍 中 关于 NP，NP-Complete 的 描述 。 

面试 中 很 多 题目 都 是 给 定 一 个 数组 ， 要 求 返回 两 个 下 标的 〈 比 如 
找 两 个 元 素 ， 或 者 找 一 个 子 数组 ) 。 而 相应 比较 高 效 的 解法 ， 则 是 先 
排序 ， 然 后 在 一 个 循环 体 里 利用 两 个 变量 进行 反 向 的 遍历 ， 并 且 这 两 
个 变量 遍历 的 方向 是 不 变 的 ， 从 而 保证 遍历 算法 的 时 间 复 杂 度 是 O 
(N) 。 以 后 读者 再 遇 到 类 似 的 问题 ， 也 可 以 考虑 利用 两 个 下 标 进 行 遍 
历 。 


2.13 “” 子 数组 的 最 大 乘积 


给 定 一 个 长 度 为 N 的 整数 数组 ， 只 人 允许 用 乘法 ， 不 能 用 除法 ， 计 算 
任意 (N 一 1) 个 数 的 组 合 乘 积 中 最 大 的 一 组 ， 并 写 出 算法 的 时 间 复 杂 
度 。 

我 们 把 所 有 可 能 的 〈N 一 1) 个 ee 分 别 计算 它们 的 
乘积 ， 并 比较 大 小 。 由 于 a (N 一 1) 个 数 的 组 合 ， 总 的 时 间 
复杂 度 为 O(N ) ， 但 显然 这 不 是 
分 析 与 解法 

【解法 一 】 

在 计算 机 科学 中 ， 时 间 和 空间 往往 是 一 对 矛盾 体 ， 不 过 ， 这 里 有 
0 可 以 通过 “空间 换 时 间 ” 或 “时 间 换 空间 ”的 策略 来 

到 优化 某 一 方面 的 效果 。 在 这 里 ， 是 否 可 以 通过 “空间 换 时 间 ” 来 降 
es 度 呢 ? 

计算 (N 一 1) 个 数 的 组 合 乘积 ， 假 设 第 i 个 (0<i<N 一 1) 元 素 被 排 
除 在 乘积 之 外 (如 图 2-13 所 示 ) 。 


图 2-13 组 合 示意 图 


设 array[] 为 初始 数组 ，s[j] 表 示 数 组 前 i 个 元 素 的 乘积 
s[i] = ] [arreyti 一 1， 其 中 1<i<N，s[0] 二 1 (边界 条 件 ) ， 那 么 s[i] 二 s[i 


1 
一 1]xarray[i 一 1]， 其 中 i=1, 2, ...，N 一 1, N; 


n 


设 t 叶 表示 数组 后 (N 一 i) 个 元 素 的 乘积 t[i] = [ | orexag ， 其 中 


1<i<N,，t[N 十 1] 二 1 (边界 条 件 ) ， 那 么 {[ 订 =t[i 十 可 xarray[ 计 ， 其 中 ij 一 
1, 2, ...， N—1, N; 

那么 设 p[i 为 数组 除 第 i 个 元 素 外 ， 其 他 N 一 1 个 元 素 的 乘积 ， 即 
有 : 

p 趾 一 s[i 一 1xt[i 十 1]。 

由 于 只 需要 从 头 至 尾 ， 和 从 尾 至 头 扫描 数组 两 次 即 可 得 到 数组 s[] 
和 t[]， 进 而 线性 时 间 可 以 得 到 p[]。 所 以 ， 很 容易 就 可 以 得 到 p[] 的 最 大 
值 〈 只 需 遍 历 p[] 一 次 ) 。 总 的 时 间 复 杂 度 等 于 计算 数组 s[]、t[]、p[ 的 
时 间 复 杂 度 加 上 查找 p[] 最 大 值 的 时 间 复 杂 度 等 于 O (N) 。 

【解法 二 】 

其 实 ， 还 可 以 通过 分 析 ， 进 一 步 减 少 解答 问题 的 计算 量 。 假 设 N 个 
整数 的 乘积 为 P， 针 对 P 的 正 负 性 进行 如 下 分 析 (其 中 ，AN_1 表示 N 一 
1 个 数 的 组 合 ，PN_; 表示 N 一 1 个 数 的 组 合 的 乘积 ) : 

1. P 为 0 

那么 ， 数 组 中 至 少 包 含有 一 个 0。 假 设 除去 一 个 0 之 外 ， 其 他 N 一 1 
个 数 的 乘积 为 Q， 根 据 Q 的 正 负 性 进行 讨论 : 

Q 为 0 

说 明 数 组 中 至 少 有 两 个 0， 那 么 N 一 1 个 数 的 乘积 只 能 为 0， 返 回 0; 

Q 为 正 数 

返回 Q， 因 为 如 果 以 0 替换 此 时 AN_; 中 的 任 一 个 数 ， 所 得 到 的 P、_ 
1 为 0， 必 然 小 于 Q; 

Q 为 负数 

如 果 以 0 替换 此 时 AN_; 中 的 任 一 个 数 ， 所 得 到 的 PN_; 为 0， 大 于 
Q， 乘 积 最 大 值 为 0。 

2. P 为 负数 


根据 * 负 负 得 正 ” 的 乘法 性 质 ， 自 然 想 到 从 N 个 整数 中 去 掉 一 个 负 
数 ， 使 得 PN_; 为 一 个 正 数 。 而 要 使 这 个 正 数 最 大 ， 这 个 被 去 掉 的 负数 
的 绝对 值 必须 是 数组 中 最 小 的 。 我 们 只 需要 扫描 一 遍 数 组 ， 把 绝对 值 
最 小 的 负数 给 去 掉 就 可 以 了 。 

3. P 为 正 数 

类 似 P 为 负数 的 情况 ， 应 该 去 掉 一 个 绝对 值 最 小 的 正 数值 ， 这 样 得 
到 的 PN_; 就 是 最 大 的 。 

上 面 的 解法 采用 了 直接 求 N 个 整数 的 乘积 P， 进 而 判断 P 的 正 负 性 的 
办 法 ， 但 是 直接 求 乘积 在 编译 环境 下 往往 会 有 溢出 的 危险 (这 也 就 是 
本 题 要 求 不 使 用 除法 的 潜在 用 意 @) ， 事 实 上 可 做 一 个 小 的 转变 ， 不 
需要 直接 求 乘积 ， 而 是 求 出 数组 中 正 数 (+) 、 负 数 (-) 和 0 的 个 数 ， 
从 而 判断 P 的 正 负 性 ， 其 余部 分 与 以 上 面 的 解法 相同 。 

在 时 间 复 杂 度 方面 ， 由 于 只 需要 遍历 数组 一 次 ， 在 遍历 数组 的 同 
时 就 可 得 到 数组 中 正 数 (+) 、 负 数 〈-) 和 0 的 个 数 ， 以 及 数组 中 绝对 
值 最 小 的 正 数 和 负数 ， 时 间 复 杂 度 为 O (N) 。 


2.14 ” 求 数 组 的 子 数组 之 和 的 最 大 值 


一 个 有 NN 个 整数 元 素 的 一 维 数组 (A[0],，A[1], ...，A[n 一 2],A[n 
一 1]) ， 这 个 数组 当然 有 很 多 子 数 组 ， 那 么 子 数组 之 和 的 最 大 值 是 什么 
呢 ? 

这 是 一 道 看 似 简单 ， 实 际 上 也 挺 简单 ， 但 是 却 难 倒 了 不 少 学 生 的 
题目 。 这 也 是 很 多 公司 面试 的 题目 ， 微 软 亚 洲 研究 院 曾 在 2006 年 的 笔 
试题 中 出 过 这 道 题 ， 只 有 20% 的 人 能 够 写 出 正确 的 解法 ， 能 做 到 最 优 O 
(N) 解法 的 同学 非常 少 。 事 实 上 这 个 题目 及 相关 解答 在 网 上 都 能 够 找 
到 ， 不 过 散布 于 网 上 的 几 个 版 本 似乎 都 有 不 正确 的 地 方 ， 我 们 在 这 里 


总 结 一 下 。 


分 析 与 解法 
【解法 一 】 
我 们 先 明 确 题 意 : 


1. 题目 说 的 子 数组 ， 是 连续 的 。 

2. 题目 只 需要 求 和 ， 并 不 需要 返回 子 数 组 的 具体 位 置 。 

3. 数组 的 元 素 是 整数 ， 所 以 数组 可 能 包含 有 正 整 数 、 零 、 负 整 
数 。 

举 几 个 例子 : 

数组 : [1，-2，3，5，-3，2] 应 返回 : 8 

数组 : [0，-2，3，5，-1，2] 应 返回 : 9 

数组 : [-9，-2，-3，-5，-3] 应 返回 : -2， 这 也 是 最 大 子 数组 的 和 。 

这 几 个 典型 的 输入 能 帮助 我 们 测试 算法 的 有 逻辑。 在 与 具 体 算法 前 
列 出 各 种 可 能 输入 ， 也 可 以 让 应 聘 者 有 机 会 和 面试 者 交流 ， 明 确 题目 
的 要 求 。 例 如 : 如 果 数 组 中 全 部 是 负数 ， 怎 么 办 ? 是 返回 9， 还 是 最 大 
的 负数 ? 这 是 面试 和 闭卷 考试 不 一 样 的 地 方 ， 要 抓 住 机 会 交流 。 


了 解 了 题 意 之 后 ， 我 们 试验 最 直接 的 方法 ， 记 Sum[i，..., j] 为 数 
组 A 中 第 i 个 元 素 到 第 j 个 元 素 的 和 (其 中 0<=i<=j<n) ， 遍 历 所 有 可 
能 的 Sum[i，...，j]， 那 么 时 间 复 杂 度 为 O(N3) : 
代码 清单 2-24 


nt MaxSum(int* A, int n) 


如 果 注 意 到 Sum[i，..., j] 二 Sum[i，..., j 一 1] 十 A[j]， 则 可 以 将 算 
法 中 的 最 后 一 个 for 

循环 省 略 ， 避 人 免 重 复 计算 ， 从 而 使 得 算法 得 以 改进 ， 改 进 后 的 算 
法 如 下 ， 这 时 复杂 度 为 O(N? ) : 
代码 清单 2-25 


能 继续 优化 吗 ? 
【解法 二 】 

如 果 将 所 给 数组 (A[0]，...，A[n 一 1]) 分 为 长 度 相等 的 两 段 数组 
(A[0]，...，A[n/2 一 1]) 和 (A[m/2]，...，A[n 一 1]) ， 分 别 求 出 这 两 
及 数组 各 自 的 最 大 子 段 和 ， 则 原 数 组 (A[0]，...，A[n 一 1]) 的 最 大 子 
段 和 为 以 下 三 种 情况 的 最 大 值 : 

1. (A[0]，...，A[n 一 1]) 的 最 大 子 段 和 与 (A[0], ...，A[n/2 一 
1]) 的 最 大 子 段 和 相同 。 

2. (A[0]，...，A[n 一 1]) 的 最 大 子 段 和 与 (A[n/2], ...，Al[n 一 
1]) 的 最 大 子 段 和 相同 。 

3. (A[0]，...，A[n 一 1]) 的 最 大 子 段 跨 过 其 中 间 两 个 元 素 A[n/2 
一 1] 到 A[n/2]。 

1 和 2 两 种 情况 事实 上 是 问题 规模 减 半 的 相同 子 问题 ， 可 以 通过 递 
归 求 得 。 

至 于 第 3 种 情况 ， 我 们 只 要 找到 以 A[n/2 一 1 结尾 的 和 最 大 的 一 段 数 
组 和 s; 三 (A[i],，...，A[n/2 一 1]) (0<=i<n/2 一 1) A[] 和 以 A[n/2] 开 
始 和 最 大 的 一 段 和 s, 二 (A[n/2]，...，A[j])”(m2 达 =j<n) 。 那 么 第 
3 种 情况 的 最 大 值 为 sj 十 s, 二 A[i 十 ... 十 A[m2 一 1] 十 A[n/2] 十 ... 十 ADj]， 
只 需要 对 原 数 组 进行 一 次 遍历 即 可 。 


其 实 这 是 一 种 分 治 算法 ， 每 个 问题 都 可 分 解 成 为 两 个 问题 规模 减 
半 的 子 问 题 ， 再 加 上 一 次 遍历 算法 。 该 分 治 算法 的 时 间 复 杂 度 满足 典 
型 的 分 治 算法 递归 式 ， 总 的 时 间 复 杂 度 为 T (n) ==O (n*log, N) 。 

【解法 三 】 

解法 二 中 的 分 治 算法 已 经 将 时 间 复 杂 度 从 O (N* ) 降 到 了 O 
(nx*log, N) ， 应 该 说 是 一 个 不 错 的 改进 ， 但 是 否 还 可 以 进一步 将 时 间 
复杂 度 降低 呢 ? 答案 是 肯定 的 ， 从 分 治 算法 中 得 到 提示 : 可 以 考虑 数 
组 的 第 一 个 元 素 A[0]， 以 及 最 大 的 一 段 数组 (A[i]，...，A[j]) 跟 A[0] 
之 间 的 关系 ， 有 以 下 几 种 情况 : 

1. 当 0=i=j 时 ， 元 素 A[0] 本 身 构 成 和 最 大 的 一 段 ; 

2. 当 0==i<j 时 ， 和 最 大 的 一 段 以 A[0] 开 始 ，; 

3. 当 0<i 时 ， 元 素 A[0] 跟 和 最 大 的 一 段 没有 关系 。 

从 上 面 三 种 情况 可 以 看 出 ， 可 以 将 一 个 大 问题 〈N 个 元 素数 组 ) 转 
化 为 一 个 较 小 的 问题 (n 一 1 个 元 素 的 数组 ) 。 假 设 已 经 知道 

(A[1]，...，A[n 一 1]) 中 和 最 大 的 一 段 之 和 为 All[1]， 并 且 已 经 知道 
(A[1]，...，A[n 一 1]) 中 包含 A[1] 的 和 最 大 的 一 段 的 和 为 Start[1]。 那 
么 ， 根 据 上 述 分 析 的 三 种 情况 ， 不 难看 出 (A[0]，...，A[n 一 1]) 中 问 
题 的 解 All[0] 是 三 种 情况 的 最 大 值 max{A[0]，A[0] 十 Start[1]，All[1]}。 
通过 这 样 的 分 析 ， 可 以 看 出 这 个 问题 符合 无 后 效 性 ， 可 以 使 用 动态 规 
划 的 方法 来 解决 。 

代码 清单 2-26 


有 // 返回 x,y 两 者 中 的 较 大 值 


for(i = n ~- 2; i >= 0; i--) / 从 数组 末尾 往 前 遍历 ， 直 到 数组 首 


eturn All[0); // 带 历 完 数组 ，A11 [0] 中 存放 漆 结 果 


新 方法 的 时 间 复 杂 度 已 经 降 到 O (N) 了 。 

但 一 个 新 的 问题 出 现 了 : 我 们 又 额外 申请 了 两 个 数组 All[]、 
Start[]， 能 否 在 空间 方面 也 节省 一 点 呢 ? 

观察 这 两 个 递 推 式 : 


start[i] = max{A[i], Start[i+1] + A[i]} 
All[i] = max{Start [i], All[i+1]} 


第 一 个 递 推 式 : Start[i] 二 max{A[i]，Start[i 十 1] 十 A[i]}。 如 果 Start[i 
十 HJ<0， 则 Start 加 三 A 跨 。 而 且 ， 在 这 两 个 递 推 式 中 ， 其 实 都 只 需要 用 
两 个 变量 就 可 以 了 。Start[k 十 1] 只 有 在 计算 start[k] 时 使 用 ， 而 Allk 十 1] 
也 只 有 在 计算 All[k] 时 使 用 。 所 以 程序 可 以 进一步 改进 一 下 ， 只 需 O 
(1) 的 空间 就 足够 了 。 
代码 清单 2-27 


int m (int ”EC 
{ 
n ( y) y 
用 于 比较 x 和 y 的 大 小 ， 返 回 x 和 y 中 的 较 大 者 
int MaxSum(int* A, int n) 
{ 
// 要 做 参数 检查 
nStart A[n 
nAll = A[ln — 1]; 
for (i 7 ) 
t = max(A[i], ta A[i]); 
忆 = max{(nStart All) 
t r N11 


改进 的 算法 不 仅 节省 了 空间 ， 而 且 只 有 窒 容 几 行 ， 却 达到 了 很 高 
的 效率 ， 是 不 是 很 美 呢 ? 

我 们 还 可 以 换 一 个 写法 : 
代码 清单 2-28 


int MaxSum(int* A, int n) 
// 要 做 输入 参数 检查 
nSstart = A[n 
nAll 有 [In 办 
rl = Nn ? = paw) 
ft (nStart < 0) 
nStart = 0; /1 数组 全 部 是 负数 ， 如 何 ? 
ns rt += [1]; 
f (nSstart nAl1l) 
All = nsSta 


扩展 问题 


1. 如 果 数 组 (A[0]，...，A[n 一 1]) 首尾 相 邻 ， 也 就 是 我 们 允许 找 
到 一 段 数 字 (A[i], .An 一 1 ，A[0]，.…….， AT[j]) ) 请 使 其 和 最 大 ， 
怎么 办 ? 

可 以 把 问题 的 解 分 为 两 种 情 ; 


(1) 解 没有 跨 过 A[n 一 1 到 A[0] ( 原 问 题 ) 。 
(2) 解 跨 过 A[n 一 1] 到 A[0]。 
对 于 第 二 种 情况 ， 只 要 找到 从 A[0] 开 始 和 最 大 的 一 段 (A[0]，.……， 
A[j]) (0<=j<n) ， 以 及 以 Amn 一 1 结尾 的 和 最 大 的 一 段 
(A 日 ，.…，Am 一 4) (0<=i<n) ， 那 么 ， 第 二 种 情况 中 ， 和 的 最 
大 值 M_2 为 : 
M_2 一 A 上 十 ... 十 AIn 一 器 十 A[0] 十 .…. 十 ADj] 
如 果 i>>j， 则 
M_ 2 一 A[0] 十 ... 十 Amn 一 革 
否则 
M_2 二 A[0] 十 ... 十 A 十 A 十 ... 十 A[n 一 1 
最 后 ， 再 取 两 种 情况 的 最 大 值 就 可 以 了 ， 求 解 跨 过 A[n 一 1] 到 A[0] 
的 情况 只 需要 遍历 数组 一 次 ， 故 总 的 时 间 复 杂 度 为 O(N) 十 O(N) 
=0O (N) 。 
2. 如 果 题 目 要 求 同 时 返回 最 大 子 数组 的 位 置 ， 算 法 应 如 何 改 变 ? 
还 能 保持 O(N) 的 时 间 复 杂 度 么 ? 


2.15” 子 数组 之 和 的 最 大 值 (二 维 ) 


我 们 在 前 面 分 析 了 一 维 数组 的 子 数组 之 和 最 大 值 的 问题 ， 那 么 如 
果 是 二 维 数组 又 该 如 何 分 析 呢 ? 
分 析 与 解法 

最 直接 的 方法 ， 当 然 就 是 枚 举 每 一 个 矩形 区 域 ， 然 后 再 求 这 个 和 矩 
形 区 域 中 元 素 的 和 。 
【解法 一 】 
代码 清单 2-29 


用 于 比较 x 和 Yy 的 大 小 ， 返 回 x 和 y 中 的 较 大 者 


采用 这 种 方法 的 时 间 复 杂 度 为 O (N2 *M2 *Sum 的 时 间 复 杂 度 ) 。 
上 面 Sum 函 数 是 以 (i_min, j min) 、 (i_min, j max) 、 (i_max, 
j_min) 、 (i_max，j_max) 为 顶点 的 矩形 区 域 (图 2-14 的 灰色 部 分 ) 
中 元 素 之 和 。 求 和 矩形 区 域 中 元 素 之 和 若 仍 采用 最 直接 的 遍历 ， 时 间 复 
杂 度 就 太 大 了 。 


图 2-14 ”二 维 最 大 值 示意 图 


考虑 到 区 域 的 和 需要 被 频繁 计算 ， 或 许 我 们 可 以 做 一 些 预 处理 ， 
并 把 计算 结果 存 下 来 ， 以 达到 “空间 换 时 间 ” 的 目的 。 事 实 上 ， 的 确 可 
以 这 样 做 。 通 过 “部 分 和 ”的 O(N*M) 预 处 理 ， 可 以 在 O (1) 时 间 内 
计算 出 任意 一 个 区 域 的 和 。 

关于 “部 分 和 ”， 先 看 一 维 数 组 (A[1]，...，A[n]) ， 如 果 事 先 记 录 
下 PS[i]: 

PS[0] 二 0， 边 界 值 

PS[i]==PS[i 一 1] 十 A[i] 二 A[1]+...+A[i] (0<i<=n) 

那么 ， 数 组 中 任意 一 段 (A[i]，...，A[j]) 的 元 素 之 和 等 于 PS[j] 一 
PS[i 一 1]。 

类 似 地 ， 在 二 维 情况 下 ， 定 义 * 部 分 和 ”PS[i][j] 等 于 以 (1，1) ， 
(i，1) ， (1, j) ， (i,j) 为 顶点 的 矩形 区 域 的 元 素 之 和 。 


1  ] mn ]j] max RAT 
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图 2 一 15 “二 维 最 大 值 示意 图 


通过 图 2 一 15 也 可 以 看 出 ， 以 (i_min, j min) ， (〈imin， 
j_max) ， (max，j_ min) ， (max，j_max) 为 顶点 的 和 矩形 区 域 的 
元 素 之 和 ， 等 于 PS[i_max][j_ max] 一 PS[i_min 一 1][j_max] 一 PS[i_max] 
[j_min 一 1] 十 PS[i_min 一 1][j_min 一 1]。 也 就 是 在 已 知 “ 部 分 和 ”的 基础 上 
可 以 用 O (1) 时 间 算 出 任意 矩形 区 域 的 元 素 之 和 。 

万 事 俱 备 ， 只 欠 “ 部 分 和 ”。 怎 么 快速 预 处 理 以 得 到 所 有 “部 分 和 ” 
呢 ? 


图 2-16 ”二 维 最 大 值 示意 图 


观察 图 2-16 不 难看 出 ， 在 更 小 “部 分 和 ”的 基础 上 ， 也 能 以 O (1) 
时 间 得 到 新 的 “部 分 和 ”图 2-16 中 PS[i][j] 二 PS[i 一 1][j] 十 PS[i][j 一 1] 一 
PS[i 一 1]0j 一 1 十 B[i[j]， 其 中 B[i] 上 j 为 矩阵 中 第 i 行 第 j 列 的 元 素 (下 标 从 
1 开始 ) 。 因 此 ，O (N*M) 的 时 间 就 足够 预 处 理 并 得 到 所 有 部 分 和 : 


for(i = 0; i <=n; i++) 


PS[i][0] = 0; // 边界 值 
for(j = 0; j <= M; j++) 
PS[0] [j] = 0; // 边界 值 
for(i= 1 <= Nn; i++) 
orl = ] <= M; J++) 
PORhdi Pst hE 


综 上 所 述 ， 我 们 得 到 了 一 个 时 间 复 杂 度 为 O(N* *M“ ) 的 解法 。 


【解法 二 】 
是 否 还 可 以 找到 更 快 的 方法 呢 ? 前面 我 们 发 现 一 维 的 解答 可 以 线 
性 完成 。 如 果 我 们 能 把 问题 从 二 维 转化 为 一 维 ， 或 许可 以 再 改进 一 
下 。 
假设 已 经 确定 了 和 矩形 区 域 的 上 下 边界 ， 比 如 知道 矩形 区 域 的 上 下 
边界 分 别 是 第 a 行 和 第 c 行 ， 现 在 要 确定 左右 边界 。 
1 TV 1 RAT 


图 2-17 二 维 示 意图 


如 图 2-17 所 示 ， 其 实 这 个 问题 就 是 一 维 的 ， 可 以 把 每 一 列 中 第 a 行 
和 第 c 行 之 间 的 元 素 看 成 一 个 整体 。 即 求 数组 (BC[1]，...，BC[M]) 中 
和 最 大 的 一 段 ， 其 中 BC[i]==B[a][i] 十 ... 十 B[c]j[i]l。 

这 样 ， 我 们 枚 举 矩 形 上 下 边界 ， 然 后 再 用 一 维 情况 下 的 方法 确定 
左右 边界 ， 就 可 以 得 到 二 维 问题 的 解 。 新 方法 的 时 间 复 杂 度 为 O(N? 
*M) 。 
代码 清单 2-30 


BC (a，c，i) ， 表 示 在 第 a 行 和 第 c 行 之 间 的 第 i 列 的 所 有 元 素 的 
和 ， 显 然 可 以 通过 “部 分 和 ”在 O (1) 时 间 内 计算 出 来 ， 它 等 于 PS[c][i 
—PS[a—1][i]—PS[c][i—1] 十 PS[a 一 1][i 一 1]。 

当然 ， 也 可 以 枚 举 左 右边 界 ， 再 用 一 维 情况 下 的 方法 确定 上 下 边 
界 ， 它 们 本 质 上 是 一 样 的 。 至 此 ， 这 个 问题 只 需 O (N*M*min (N， 
M) ) 的 时 间 就 可 以 解决 了 。 
扩展 问题 


1. 如 果 二 维 数组 也 是 首尾 相连 ， 像 一 条 首尾 相连 的 融 子 ， 算 法 会 


如 何 改变 ? 


图 2-18 


2. 在 上 面 的 基础 上 ， 如 果 这 个 二 维 数组 的 上 下 也 相连 ， 就 像 一 个 
游泳 圈 (如 图 2-18 所 示 ) ， 算 法 应 该 怎样 修改 ? 

3. 在 三 维 数组 C[i][j][k] (1<=i<=N, 1<=j<=M, 1<=k< 
二 L) 中 找 出 一 块 长 方 体 ， 使 得 和 最 大 。 

4. 如 果 再 将 问题 扩展 到 四 维 的 情况 又 如 何 呢 ? 请 读者 根据 以 上 的 
分 析 ， 想 出 一 个 优化 解法 。 

还 有 一 个 扩展 问题 .….... 算 了 ， 下 次 吧 。 @ 


2.16 ” 求 数组 中 最 长 递增 子 序列 


写 一 个 时 间 复 杂 度 尽 可 能 低 的 程序 ， 求 一 个 一 维 数组 (N 个 元 素 ) 
中 的 最 长 递增 子 序 列 的 长 度 。 

例如 : 在 序列 1，-1，2，-3，4，-5，6，-7 中 ， 其 最 长 的 递增 子 序 
列 为 1，2，4，6。 


分 析 与 解法 


根据 题目 的 要 求 ， 求 一 维 数组 中 的 最 长 递增 子 序列 ， 也 就 是 找 一 
个 标号 的 序列 b[0]，b[1]，..….，b[m] (0< =b[0]<b[1H<.….<b[rm]< 
N) ， 使 得 array[b[0]]<array[b[1]]<.….<array[b[m]]。 

[解法 一 】 

根据 无 后 效 性 的 定义 我 们 知道 ， 将 各 阶段 按照 一 定 的 次 序 排列 好 
之 后 ， 对 于 某 个 给 定 的 阶段 状态 来 说 ， 它 以 前 各 阶段 的 状态 无 法 直接 
影响 它 未 来 的 决策 ， 而 只 能 间接 地 通过 当前 的 这 个 状态 来 影响 。 换 名 
话说 ， 每 个 状态 都 是 过 去 历史 的 一 个 完整 总 结 。 

同样 地 ， 仍 以 序列 1，-1，2，-3，4，-5，6，-7 为 例 ， 我 们 在 找到 4 
之 后 ， 并 不 关心 4 之 前 的 两 个 值 具 体 是 怎样 ， 因 为 它 对 找到 6 并 没有 直 
接 影响 。 因 此 ， 这 个 问题 满足 无 后 效 性 ， 可 以 使 用 动态 规划 来 解决 。 

可 以 通过 数字 的 规律 来 分 析 目 标 串 : 1，-1，2，-3，4，-5， 
2 

使 用 i 来 表示 当前 遍历 的 位 置 : 

当 i 二 1 时 ， 显 然 ， 最 长 的 递增 序列 为 (1) ， 序 列 长 度 为 1。 

当 i 二 2 时 ， 由 于 -1<1。 因 此 ， 必 须 丢 弃 第 一 个 值 然后 重新 建立 
串 。 当 前 的 递增 序列 为 〈-1) ， 长 度 为 1。 

当 i 王 3 时， 由 于 2>1，2>-1。 因 此 ， 最 长 的 递增 序列 为 〈1， 

2) ， (-1，2) ， 长 度 为 2。 在 这 里 ，2 前 面 是 1 还 是 -1 对 求 出 后 面 的 递 
增 序列 没有 直接 影响 。 


依 此 类 推 之 后 ， 可 以 得 出 如 下 的 结论 : 

假设 在 目标 数组 array[] 的 前 i 个 元 素 中 ， 最 长 递增 子 序列 的 长 度 为 
LIS[i]。 那 么 ， 

LIST 十 1 一 max{1，LIS[k] 十 1}，array[i 十 1 之 array[k]，for any 上 < 
=i 

即 如 果 array[i 十 1] 大 于 array[k]， 那 么 第 i 十 1 个 元 素 可 以 接 在 LIS[k] 
长 的 子 序列 后 面 构 成 一 个 更 长 的 子 序列 。 与 此 同时 array[i 十 1] 本 身 至 少 
可 以 构成 一 个 长 度 为 1 的 子 序列 。 

根据 上 面 的 分 析 ， 就 可 以 得 到 如 下 代码 : 
代码 清单 2-31 C# 代 码 


| array) 


初始 化 默认 的 长 度 
上 OF (TInt 0; < 导出) 1/ 找 出 前 面 最 长 的 序列 


机 


x (LIS); // 取 LIS 的 最 大 值 


这 种 方法 的 时 间 复 杂 度 为 O(N* 十 N) =O (N2 ) 。 
【解法 二 】 

显然 ，O (N?* ) 的 算法 只 是 一 个 比较 基本 的 解法 ， 我 们 需要 想 想 
看 是 否 能 够 进一步 提高 效率 。 在 前 面 的 分 析 中 ， 当 考察 第 i 十 1 个 元 素 的 
时 候 ， 我 们 是 不 考虑 前 面 i 个 元 素 的 分 布 情况 的 。 现 在 我 们 从 另 一 个 角 
度 分 析 ， 即 当 考 察 第 i 十 1 个 元 素 的 时 候 考 虑 前 面 i 个 元 素 的 情况 。 

对 于 前 面 i 个 元 素 的 任何 一 个 递增 子 序列 ， 如 果 这 个 子 序列 的 最 大 
的 元 素 比 array[i 十 1] 小 ， 那 么 就 可 以 将 array[i 十 1] 加 在 这 个 子 序列 后 
面 ， 构成 一 个 新 的 递增 子 序列 。 


比如 当 i= 二 4 的 时 候 ， 目 标 序 列 为 : 1，-1，2，-3，4，-5，6，-7 最 
长 递增 序列 为 : (1, 2) ， (-1, 2) 。 

那么 ， 只 要 4 之 2， 就 可 以 把 4 直接 增加 到 前 面 的 子 序列 中 形成 一 个 
新 的 递增 子 序列 。 

因此 ， 我 们 希望 找到 前 i 个 元 素 中 的 一 个 递增 子 序列 ， 使 得 这 个 递 
增 子 序列 的 最 大 的 元 素 比 array[i 十 1 小 ， 且 长 度 尽 量 地 长 。 这 样 将 
array[i 十 1] 加 在 该 递增 子 序列 后 ， 便 可 找到 以 array[i 十 1] 为 最 大 元 素 的 
最 长 递增 子 序列 。 

仍然 假设 在 数组 的 前 个 元 素 中 ， 以 array[i] 为 最 大 元 素 的 最 长 递增 
子 序列 的 长 度 为 LIS[i]。 

同时 ， 假 设 : 

长 度 为 1 的 递增 子 序列 最 大 元 素 的 最 小 值 为 MaxV[1]; 

长 度 为 2 的 递增 子 序列 最 大 元 素 的 最 小 值 为 MaxV[2]; 

长 度 为 LIS[i] 的 递增 子 序列 最 大 元 素 的 最 小 值 为 MaxV[LIS[i]]。 

假如 维护 了 这 些 值 ， 那 么 ， 在 算法 中 就 可 以 利用 相关 的 信息 来 减 
少 判 断 的 次 数 。 

具体 算法 实现 如 下 : 
代码 清单 2-32”C# 代 码 


int LIS(int[) array) 
t 
// 记录 数组 中 的 递增 序列 信息 


int[] MaxV = new intlarray.Length + 1]; 


MaxV[1] = array{(0]; // 数组 中 的 第 一 值 ， 边 界 值 
MaxV[0] = Min{array) - 1; // 数组 中 最 小 值 ， 边 界 值 


zint[l] LIS = new int [array.Lengthj]: 


// 初始 化 最 长 递增 序列 的 信息 
for(int i = 0; i < LIS.Length; i++) 
{ 
LIS[i] = 1; 
} 


int nMaxLIS = 1; // 数组 最 长 递增 子 序 列 的 长 度 


for(int i = 1; i < array.Length; i++) 
{ 
// 台历 历史 最 长 递增 序列 信息 
.I 
for(j = nMaxLIS; j >= 0; j--) 
{ 
if(array[ij > MaxV[Ijl]) 
{ 
DIS 二] mm 3] 直人; 
break; 
} 


} 
// 如 果 当 前 最 长 序列 大 于 最 长 递增 序列 长 度 ， 更 新 最 长 信息 
if(LIS[i] > nmMaxLIS) 
{ 
nMaxLIS = LIS[i]; 
MaxV[LIS[i]] = array[il]; 
} 
else If (MaxV[j] < array[i] 55 array[li] < MaxV[j + 1]) 
{ 
MaxV[j + 1] = array [i]; 
} 
} 


return nMaxLIs; 


由 于 上 述 解法 中 的 穷 举 人 遍历， 时间 复杂 度 仍然 为 O(N?) 。 
【解法 三 】 


解法 二 的 结果 似乎 仍然 不 能 让 人 满意 。 我 们 是 否 把 递增 序列 中 间 
的 关系 全 部 挖掘 出 来 了 呢 ? 再 分 析 一 下 临时 存储 下 来 的 最 长 递增 序列 
信息 。 

在 递增 序列 中 ， 如 果 i<j， 那 么 就 会 有 MaxV[i<MaxV[j]。 如 果 出 
现 MaxV[j] 之 MaxV[i] 的 情况 ， 则 跟 定义 矛盾 ， 为 什么 ? 

因此 ， 根 据 这 样 单调 递增 的 关系 ， 可 以 将 上 面 方法 中 的 穷 举 部 分 
进行 如 下 修改 : 


for(j = LIS[i-1]; J >= 1; J--) 


如 果 把 上 述 的 查询 部 分 利用 二 分 搜索 进行 加 速 ， 那 么 就 可 以 把 时 
间 复 杂 度 降 为 O(N*log, N) 。 
小 结 


从 上 面 的 分 析 中 可 以 看 出 我 们 先 提出 一 个 最 直接 (或 者 说 最 简 
单 ) 的 解法 ， 然 后 从 这 个 最 简单 解法 来 看 是 否 有 提升 的 空间 ， 进 而 一 
步 一 步 地 挖掘 解法 中 的 潜力 ， 从 而 减少 解法 的 时 间 复 杂 度 。 

在 实际 的 面试 中 ， 这 样 的 方法 同样 有 效 。 因 为 面试 者 更 加 看 中 的 
是 应 聘 者 是 否 有 解决 问题 的 思路 ， 不 会 因为 最 后 没有 达到 最 优 算法 而 
简单 地 给 予 否定 。 应 聘 者 也 可 以 先 提出 简单 的 办 法 ， 以 此 投石 问 路 ， 
看 看 面试 者 是 否 会 有 进一步 的 提示 。 


2.17 ”数组 循环 移 位 


设计 一 个 算法 ， 把 一 个 含有 N 个 元 素 的 数组 循环 右 移 K 位 ， 要 求 时 
间 复 杂 度 为 O(N) ， 且 只 人 允许 使 用 两 个 附加 变量 。 
` 合 题 意 的 解法 如 下 : 
我 们 先 试验 简单 的 办 法 ， 可 以 每 次 将 数组 中 的 元 素 右 移 一 位 ， 循 
环 K 次 。abcd1234 一 4abcd123 ~ 34abcd12 ~ 234abcd1 ~ 1234abcd。 伪 代 
码 如 下 : 
代码 清单 2-33 


(只 ) 


虽然 这 个 算法 可 以 实现 数组 的 循环 右 移 ， 但 是 算法 复杂 度 为 O 
(K*N) ， 不 符合 题目 的 要 求 ， 需 要 继续 往 下 探索 。 
分 析 与 解法 

假如 数组 为 abcd1234， 循 环 右 移 4 位 的 话 ， 我 们 希望 到 达 的 状态 是 
1234abcd。 不 妨 设 K 是 一 个 非 负 的 整数 ， 当 K 为 负 整 数 的 时 候 ， 右 移 K 
位 ， 相 当 于 左 移 (-K) 位 。 左 移 和 右 移 在 本 质 上 是 一 样 的 。 

【解法 一 】 

大 家 开始 可 能 会 有 这 样 的 潜在 假设 ， K<N。 事 实 上 ， 很 多 时 候 也 
的 确 是 这 样 的。 但 严格 地 说 ， 我 们 不 能 用 这 样 的 “惯性 思维 ”来 思考 问 
题 。 尤 其 在 编程 的 时 候 ， 全 面 地 考虑 问题 是 很 重要 的 ，K 可 能 是 一 个 远 
大 于 N 的 整数 ， 在 这 个 时 候 ， 上 面 的 解法 是 需要 改进 的 。 


仔细 观察 循环 右 移 的 特点 ， 不 难 发 现 : 每 个 元 素 右 移 N 位 后 都 会 回 
到 自己 的 位 置 上 。 因 此 ， 如 果 K>>N， 右 移 K 一 N 之 后 的 数组 序列 跟 右 
移 K 位 的 结果 是 一 样 的。 进而 可 得 出 一 条 通用 的 规律 : 右 移 K 位 之 后 的 
情形 ， 跟 右 移 K ' 二 K%N 位 之 后 的 情形 一 样 。 
代码 清单 2-34 


RightSshift (int* arr, int N, int K) 


可 见 ， 增 加 考虑 循环 右 移 的 特点 之 后 ， 算 法 复杂 度 降 为 O(N? 
) ， 这 跟 K 无 关 ， 与 题目 的 要 求 又 接近 了 一 步 。 但 时 间 复 杂 度 还 不 够 
低 ， 接 下 来 让 我 们 继续 挖掘 循环 右 移 前 后 ， 数 组 之 间 的 关联 。 
【解法 二 】 

假设 原 数组 序列 为 abcd1234， 要 求 变换 成 的 数组 序列 为 1234abcd， 
即 循环 右 移 了 4 位 。 比 较 之 后 ， 不 难看 出 ， 其 中 有 两 段 的 顺序 是 不 变 
的 : 1234 和 abcd， 可 把 这 两 段 看 成 两 个 整体 。 右 移 K 位 的 过 程 就 是 把 数 
组 的 两 部 分 交换 一 下 。 变 换 的 过 程 通过 以 下 步骤 完成 : 

1. 逆序 排列 abcd: abcd1234 ~ dcba1234; 

2. 逆序 排列 1234: dcba1234 一 dcba4321; 

3. 全 部 逆序 : dcba4321 一 1234abcd。 

伪 代 码 可 以 参考 如 下 : 
代码 清单 2-35 


Reverset{int* arr, int b, int el) 
{ 
for(; b < e; bt++, e-—) 


{ 
int temp = arr[e]; 
arr[le] = arr[b]; 
arr[b] = temp; 

} 


} 


RightShift (int* arr, int N, int k) 
{ 


K $= N; 

Reversel(arr, 0, N- KK 1); 
Reverse(arr, NN- K, N 一 1); 
Reverse (arr, 0, N - 1); 


这 样 ， 我 们 就 可 以 在 线性 时 间 内 实现 右 移 操作 了 。 


2.18 ”数组 分 割 


有 一 个 没有 排序 、 元 素 个 数 为 2n 的 正 整数 数组 ， 要 求 : 如 何 能 把 
这 个 数组 分 割 为 元 素 个 数 为 n 的 两 个 数组 ， 并 使 两 个 子 数组 的 和 最 接 
近 ? 
分 析 与 解法 
从 题目 中 可 以 分 析出 ， 题 目的 本 质 就 是 要 从 2n 个 整数 中 找 出 n 个 ， 
使 得 它们 的 和 尽 可 能 地 靠近 所 有 整数 之 和 的 一 半 。 
【解法 一 】 
看 到 这 个 题目 后 ， 一 个 直观 的 想法 是 : 
先 将 数组 的 所 有 元 素 排序 为 ai <a, <...<dNn 3 
将 它们 划分 为 两 个 子 数组 S1 =[al ，aa ，as ，...，asN_1 ] 和 S, 二 
[a ， ay， a6，, ...， do 
从 S; 和 S, 中 找 出 一 对 数 进行 交换 ， 使 得 SUM (Si ) 和 SUM (Ss， 
) 之 间 的 值 尽 可 能 的 小 ， 直 到 找 不 到 可 对 换 的 。 这 种 想法 的 缺陷 是 得 
到 的 S; 和 S, 并 不 是 最 优 的 。 
【解法 二 】 
假设 2n 个 整数 之 和 为 SUM。 从 2n 个 整数 中 找 出 n 个 元 素 的 和 ， 不 管 
如 何 接 近 SUM/2， 同 样 都 会 存在 大 于 SUM/2 或 者 小 于 SUM/2 的 情况 。 在 
求解 这 个 问题 时 ， 大 于 或 小 于 SUM/2 没 有 本 质 的 区 别 。 因 此 ， 可 以 只 
考虑 小 于 等 于 SUM/2 的 情况 。 
比较 直观 地 来 说 ， 可 以 用 动态 规划 来 解决 这 个 问题 。 具 体 分 析 如 
下 : 
可 以 把 任务 分 成 2N 步 ， 第 k 步 的 定义 是 前 k 个 元 素 中 任意 个 元 素 的 
和 ， 所 有 可 能 的 取 值 之 集合 为 S$， (只 考虑 取 值 小 于 等 于 SUM/2 的 情 
况 ) 。 


然后 将 第 k 步 拆 分 成 两 个 小 步 。 即 首先 得 到 前 k 一 1 个 元 素 中 ， 任 意 i 
个 元 素 ， 总 共 能 有 多 少 种 取 值 ， 设 这 个 取 值 集合 为 S，; ={vi }。 第 二 
步 就 是 令 S, =S，_; U{vi 十 arr[k]}， 即 可 完成 第 k 步 。 

伪 代 码 实现 如 下 : 


代码 清单 2-36 
定义 : Heap [i] 表 未 存储 从 arr 中 取 守 个 数 所 能 产生 的 和 之 集合 的 推 


初始 化 : Heap [0] 只 有 一 个 元 素 0。Heap[i]，i) 0 没有 元 素 
for = dr kK X= ££ * Ny K++) 


i max = min(k Ls 区 


上 DT (1 i max; 工 > “hr ) 


从 有 效 性 来 分 析 ， 整 个 代码 是 一 个 三 重 循环 ， 目 的 就 是 执行 
insert。 这 个 代码 实际 执行 insert 的 次 数 至 多 是 4N 次 〈 枚 举 所 有 元 素 在 与 
不 在 的 情况 ) ， 因 此 可 以 认为 复杂 度 是 O (4N ) 。 

既然 算法 的 时 间 复 杂 度 是 N 的 指数 级 ， 因 此 在 N 很 大 时 ， 效 率 很 
低 。 我 们 不 得 不 考虑 设计 一 种 时 间 复 杂 度 是 N 的 多 项 式 遂 数 的 方法 。 考 
虑 的 出 发 点 是 ， 是 否 有 另 一 种 拆 分 第 k 步 的 方法 。 

[解法 三 】 

解法 二 的 拆 分 方法 需要 遍历 $。，; 二 {vi } 的 元 素 ， 由 于 Si; 二 {vi} 
的 元 素 个 数 随 着 k 的 增 大 而 增 大 ， 所 以 导致 了 解法 二 的 效率 低下 。 能 不 
能 设计 一 个 算法 使 得 第 k 步 所 花费 的 时 间 与 k 无 关 呢 ? 

我 们 不 妨 倒 过 来 想 ， 原 来 是 给 定 S，; ={vi }， 求 S, 。 那 我 们 能 不 
能 给 定 Si 的 可 能 值 y 和 arr[k]， 去 寻找 v 一 arr[k] 是 否 在 S._1 ={vi } 中 
呢 ? 由 于 Sy 可 能 值 的 集合 的 大 小 与 k 无 关 ， 所 以 这 样 设计 的 动态 规划 算 
法 其 第 k 步 的 时 间 复 杂 度 与 k 无 关 。 

代码 如 下 : 


代码 清单 2-37 


定义 : isOK[i] [Vj 表示 是 否 可 以 找到 i 个 数 ,使 得 它们 之 和 等 于 v 
初 妇 化 isoK[0] [0] = true; 


isoOK[il][v] false{i > 0, v > 0) 
证 二 和 和 革 n + 十 ) 
for ( ( k & i n) + 十 ) 
{ 一 V < um + 二 +) 
Lf ( arr[k] &t sOK[i ] [Vv arr[k]]) 
K[i] ] = tr 


利用 如 上 的 算法 ， 时 间 复 杂 度 将 为 O(N** Sum) 。 
讨论 


虽然 解法 三 对 于 N 是 多 项 式 时 间 算 法 ， 但 当 SUM 很 大 而 N 很 小 时 ， 
比如 对 于 arr 王 {109 ，108 ，108 十 1，109 十 1}， 这 个 解法 是 很 不 合适 
的 ， 所 以 我 们 应 该 根据 具体 的 问题 选用 合适 的 方法 。 
扩展 问题 


如 果 数 组 中 有 人 负数， 怎么 办 ? 


2.19 区 间 重 合 判断 


给 定 一 个 源 区 间 [x，y] (y>x) 和 N 个 无 序 的 目标 区 间 [x; ，yi1 ][x; 
，y2 ][xs ，y3]...[x,，y, ]， 判 断 源 区 间 [x，y] 是 不 是 在 目标 区 间 内 
(也 即 [x， yeUL, y] 是 否 成 立 ) ? 

例如 : 给 定 源 区 间 [1， 6] 和 一 组 无 序 的 目标 区 间 [2，3][1，2][3， 
9]， 即 可 认为 区 间 [1，6] 在 区 间 [2，3][1，2][3，9] 内 (因为 目标 区 间 实 
际 上 是 [1，9]) 。 
分 析 与 解法 
【解法 一 】 

问题 的 本 质 在 于 对 目标 区 间 的 处 理 。 一 个 比较 直接 的 思路 即将 源 
区 ia][x, y] (y>x) ) 和 N 个 无 序 的 目标 区 间 [xi ， yY1 ][x> ， Y2 ][xs3 ， Y3 
].….[x,，y, ] 逐 个 投影 到 坐标 轴 上 ， 只 考察 产 区 间 未 被 覆盖 的 部 分 。 如 
果 所 有 的 目标 区 间 全 部 投影 完毕 ， 仍 然 有 源 区 间 没 有 被 覆盖 ， 那 么 源 
区 间 就 不 在 目标 区 间 之 内 。 

仍 以 [L，6] 和 [2，3][1，2][3，9] 为 例 ， 考 察 [1，6] 是 否 在 [2，3][1， 
2][3，9] 内 : 

源 区 间 为 [1，6]， 那 么 最 初 未 被 覆盖 的 部 分 为 {[1，6]} (如 图 2-19 
所 示 ) ， 将 按 顺 序 考察 目标 区 间 [2，3][1，2][3，9]: 


图 2-19 


将 目标 区 间 [2，3] 投 影 到 坐标 轴 ， 那 么 未 被 覆盖 的 部 分 {[1，6]} 将 
变 为 {[1，2]，[3，6]} (如 图 2-20 所 示 ) : 


图 2-20 


将 目标 区 间 [1，2] 投 影 到 坐标 轴 ， 那 么 未 被 覆盖 的 部 分 {[1，2]， 
[3，6]} 将 变 为 {[3，6]} (如 图 2-21 所 示 ) : 


图 2-21 


将 目标 区 间 [3，9] 投 影 到 坐标 轴 ， 那 么 未 被 覆盖 的 部 分 {[3，6]} 将 
变 为 {0}， 即 可 说 明 [1，6] 是 在 [2，3][1，2][3，9] 内 (如 图 2-22 所 
示 ) ! 


| 
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图 2-22 


由 以 上 步骤 可 看 出 ， 每 次 操作 ， 尚 未 被 覆盖 的 区 间 数 组 大 小 最 多 
增加 1 (当然 可 能 减少 )  ， 而 每 投影 一 个 新 的 目标 区 间 ， 计 算 有 哪些 源 
区 间 数 组 被 覆盖 需要 O (log, N) 的 时 间 复 杂 度 ， 但 是 更 新 尚未 被 覆盖 
的 区 间 数 组 需要 O (N) 的 时 间 复 杂 度 ， 所 以 总 的 时 间 复 杂 度 为 O(N” 
) 。 

这 个 解法 的 时 间 复 杂 度 高 ， 而 且 如 果 要 对 k 组 产 区 间 进 行 查询 ， 那 
么 时 间 复 杂 度 会 增 大 单 次 查询 的 k 倍 。 有 没有 更 好 的 解法 ， 使 得 单 次 查 
询 的 时 间 复 杂 度 降低 ， 并 且 使 k 次 查询 的 时 间 复 杂 度 小 于 单 次 查询 的 时 
间 复 杂 度 的 1k 倍 呢 ? 


【解法 二 】 


一 种 值得 尝试 并 已 经 在 本 书 中 多 次 运用 的 思路 是 ， 对 现 有 的 数组 
进行 一 些 预 处 理 (如 合并 、 排 序 等 ) ， 将 无 序 的 目标 区 间 合 并 成 几 个 
有 序 的 区 间 ， 这 样 就 可 以 进行 区 间 的 比较 。 

因此 ， 问 题 就 变 成 了 如 何 将 这 些 无 序 的 数组 转化 为 一 个 目标 区 
间 。 

首先 可 以 做 一 次 数据 初始 化 的 工作 。 由 于 目标 区 间 数 组 是 无 序 
的 ， 因 此 可 以 对 其 进行 合并 操作 ， 使 其 变 得 有 序 。 

即 先 将 目标 区 间 数 组 按 X 轴 坐标 从 小 到 大 排序 (排序 时 可 采用 快速 
排序 等 ) ， 如 [2，3][1，2][3，9] 一 [1，2][2，3][3，9]; 接着 扫描 排序 
后 的 目标 区 间 数 组 ， 将 这 些 区 间 合 并 成 若干 个 互 不 相交 的 区 间 ， 如 [1， 
2][2,3][3，9] = [1，9]。 

然后 在 数据 初始 化 的 基础 上 ， 运 用 二 分 查找 (为 什么 ? ) 来 判定 
源 区 间 [x，y] 是 否 被 合并 后 的 这 些 互 不 相交 的 区 间 中 的 某 一 个 包含 。 如 
[1，6] 被 [1，9] 包 含 ， 则 可 说 明 [1，6] 在 [2，3][1，2][3，9] 内 。 

这 种 思路 相对 简单 ， 时 间 复 杂 度 计算 如 下 : 

排序 的 时 间 复 杂 度 : O(N*log, N) ”(N 为 目标 区 间 的 个 数 ) ; 

合并 的 时 间 复 杂 度 : O(N) ， 

单 次 查找 的 时 间 复 杂 度 : log, N; 

所 以 总 的 时 间 复 杂 度 为 O(N*log, N) 十 O (N) 十 O (k*log, N) 
一 O (N*log, N 十 k*log, N) ，k 为 查询 的 次 数 ， 合 并 目标 区 间 数 组 的 初 
始 化 数据 操作 只 需要 进行 一 次 。 

这 样 不 仅 单 次 查询 的 时 间 复 杂 度 降低 了 ， 而 且 对 于 k> >N 的 情 
况 ， 处 理 起 来 也 会 方便 很 多 。 


总 结 

解法 一 采用 利用 目标 区 间 来 分 割 源 区 间 的 方法 ， 会 增加 存储 空 
间 ; 解法 二 采用 合并 的 方法 ， 既 简单 又 节省 了 空间 。 
扩展 问题 


如 何 处 理 二 维 空间 的 履 盖 问题 ?例如 在 Windows 桌 面 上 有 若干 窗 
口 ， 如 何 判断 某 一 窗口 是 否 完全 被 其 他 窗口 覆盖 ? 


2.20 ”程序 理解 和 时 间 分 析 


很 多 同学 自己 会 写 不 少 程序 ， 但 是 往往 看 不 懂 别 人 写 的 程序 。 碰 
到 程序 需要 理解 时 ， 都 到 电脑 上 去 试验 ， 或 者 用 单 步 跟 踪 的 办 法 来 调 
试 。 如 果 程序 运行 的 时 间 很 长 ， 那 我 们 要 等 电脑 运行 几 天 几 夜 么 ? 用 
人 脑 行 不 行 呢 ? 在 面试 的 时 候 ， 面 试 者 也 会 考 一 考 应 聘 者 对 程序 的 理 
解 能 力 ， 下 面 就 是 一 个 这 样 的 题目 。 

不 用 电脑 的 帮助 ， 回 答 下 面 的 问题 : 
代码 清单 2-38 ”C# 代 码 


Using System; 
using System.Collections.Generic; 
Using System,Text; 


namespace FindTheNumber 


{ 


class Program 


{ 


static void Main(string[] 


{ 


args) 


int [] xg = 
(27113714156 710913031 12 137r14157 467175 
站 19:20.21.22723724/297 26,. T7028729 .30531}3 


for (Int64 
{ 


i= 1; i < Int64.MaxValue; i++) 


int hit = 0; 


int hitl = ~1; 
int hit2 = —1;}; 
for (int j = 0; (j < rg.Length) && 
! 
if((i % rg[j]) != 0) 
{ 
刀 主 七 赴 书 5 
if(hit == 1) 
( 
hitl = 3; 
} 
else if (hit == 2) 
[| 
hit2 = 3; 
} 
else 
break; 
} 
} 
if((hit == 2) && (hitl + 1 == hit2)) 
{ 
Console ,WriteLine ("found {0}", i); 


这 个 程序 要 找 的 是 符合 什么 条 件 的 数 ? 


(hit <= 


2); 


了] 十 十 ) 


这 样 的 数 存在 么 ? 符合 这 一 条 件 的 最 小 数 是 什么 ? 


问题 3: 在 电脑 上 运行 这 一 程序 ， 你 估计 多 长 时 间 才 能 输出 第 一 
结果 ? 时 间 精 确 到 分 钟 (电脑 : 单 核 CPU2.0GHz， 内 存 和 硬盘 等 资源 
充足 ) 。 

这 道 题目 没有 分 析 ， 也 没有 答案 。 读 者 得 靠 自 己 的 力量 来 搞定 。 


2.21 ”只 考 加 法 的 面试 题 


看 了 这 么 多 题目 ， 有 人 不 禁 会 想 ， 这 些 题目 都 太 难 了 ! 有 没有 容 
易 的 ? 这 里 有 一 题 ， 只 用 到 加 法 ， 大 家 别 嫌 题 目 简单 ， 不 妨 试 试看 。 

我 们 知道 : 

1 十 2 三 3 

4 十 5 一 9; 

2 十 3 十 4 一 9; 

等 式 的 左边 都 是 两 个 以 上 连续 的 自然 数 相 加 ， 那 么 是 不 是 所 有 的 
整数 都 可 以 写成 这 样 的 形式 呢 ? 稍微 者 虑 一 下 ， 我 们 发 现 ，4、8 等 数 
并 不 能 写成 这 样 的 形式 。 

问题 1; 写 一 个 程序 ， 对 于 一 个 64 位 正 整数 ， 输 出 它 所 有 可 能 的 连 
续 自然 数 (两 个 以 上 ) 之 和 的 算式 2。 

问题 2: 大 家 在 测试 上 面 程序 的 过 程 中 ， 肯 定 会 注意 到 有 一 些 数 字 
不 能 表达 为 一 系列 连续 的 自然 之 和 ， 例 如 32 好 像 就 找 不 到 。 那 么 ， 这 
样 的 数字 有 什么 规律 呢 ? 能 否 证 明 你 的 结论 ? 

问题 3: 在 64 位 正 整 数 范围 内 ， 子 序列 数目 最 多 的 数 是 哪 一 个 ? 这 
个 问题 要 用 程序 蛮 力 搜索 ， 疏 怕 要 运行 很 长 时 间 ， 能 否 用 数学 知识 推 
导出 来 ? 


注释 


QD ”这 个 规律 请 读者 自己 证 明 (提示 Nk， 等 于 ，2，3，..….，N 中 能 被 k 整 除 的 数 的 个 
数 ) 。 

包 ”ceil (ceiling， 天 花 板 之 意 ) 表示 大 于 等 于 一 个 浮 点 数 的 最 小 整数 。 

@) ”当然 ， 在 写 这 个 程序 的 时 候 ， 可 以 用 各 种 运算 ， 不 限于 加 法 。 


第 3 章 


结构 之 法 
一 一 字符 串 及 链表 的 探索 
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研究 院 每 天 下 午 三 点 钟 有 大 量 新 鲜 水 果 供应 ， 这 是 大 家 每 天 盼望 
的 时 刻 ， 部 分 同事 还 拍 了 一 部 叫 “ 三 点 ”的 电影 ， 限 量 发 行 。 


这 一 章 履 盖 了 常用 的 数据 结构 。 对 字符 串 、 链 表 、 队 列 和 树 等 数 
据 结 构 的 处 理 几乎 是 每 个 程序 中 会 涉及 的 问题 。 同 学 们 在 课堂 上 也 学 
过 ， 这 些 问 题 有 什么 好 考 的 呢 ? 

大 家 都 知道 二 叉 树 的 前 序 、 中 序 和 后 序 遍 历 算 法 ， 但 是 当 给 出 了 
两 个 遍历 输出 的 结果 ， 要 求 还 原 二 叉 树 的 时 候 ， 就 能 考察 出 大 家 是 否 
真正 掌握 了 这 些 不 同 遍 历 算法 的 含义 及 使 用 它们 的 办 法 。 

有 些 同 学 对 于 “指针 ”比较 恐惧 ， 笔 者 也 听 说 某 些 大 学 里 *C 语 言 "这 
门 课 不 讲 指针 ， 于 是 学 生 和 老师 在 上 课 的 时 候 都 轻松 了 一 阵子 ， 但 是 
在 找 工 作 和 实际 工作 中 ， 就 不 轻松 了 一 “出 来 混 ， 总 是 要 还 的 ”。 事 实 
上 指针 就 是 内 存 中 的 地 址 ， 没 什么 可 怕 的 。 

有 不 少 同学 学 习 了 Java、C#， 这 些 现代 的 语言 和 运行 环境 (例如 
JavaVM、CLR) 通常 把 实现 的 细节 给 掩盖 了 。 你 觉得 很 方便 ， 例 如 : 
要 排序 ， 则 array.sort()， 要 新 的 实体 ， 就 new() 一 个 ， 不 用 担心 什么 时 候 
需要 释放 ， 多 好 ! 但 是 不 要 志 了 有 人 句 谚 语 : The devil is in the details。 

在 “操控 CPU 使 用 率 ” 这 个 面试 题目 中 ， 有 一 个 应 聘 者 的 C# 代 码 从 
逻辑 上 看 都 没有 任何 问题 ， 但 是 在 运行 中 ，CPU 的 使 用 率 就 是 不 平 
滑 ， 会 突然 产生 巨大 的 抖动 ， 然 后 回归 正常 。 反 复 研 究 之 后 ， 发 现 问 
题 原来 出 自 一 一 

TimeSpan ts=new TimeSpan(); 

这 人 句 话 没有 错 ， 但 是 他 把 这 人 句 话 放 在 了 一 个 循环 里 面 ， 这 样 在 很 
短 的 时 间 内 ， 程 序 就 创建 了 大 量 的 TimeSpan 对 象 。 程 序 员 不 管 释放 ， 
但 是 CLR 要 管 ， 所 以 CLR 就 要 经 常 进行 垃圾 清理 〈《GC) 工作， 导致 
CPU 的 使 用 率 急剧 上 涨 。 这 些 details (细节 ) 处 理 不 好 ， 你 的 程序 就 会 
出 现 你 不 能 理解 的 奇怪 行为 。 


3.1 字符 串 移 位 包含 的 问题 


给 定 两 个 字符 串 s1 和 s， ， 要 求 判定 ss 是 否 能 够 被 通过 si 作 循环 移 
位 (rotate) 得 到 的 字符 串 包 含 。 例 如 ， 给 定 s; 二 AABCD 和 s, = 
CDAA， 返 回 true; 给 定 s; 二 ABCD 和 s, 二 ACBD， 返 回 falseo 
分 析 与 解法 
【解法 一 】 

从 题目 中 可 以 看 出 ， 我 们 可 以 使 用 最 直接 的 方法 对 $; 进行 循环 移 
位 ， 再 进行 字符 串 包含 的 判断 ， 从 而 遍历 其 所 有 的 可 能 性 。 

因此 ， 可 以 用 如 下 的 代码 实现 : 
代码 清单 3-1 


Len = 三 Strlien(s} 


如 上 ， 穷 举 s，( 如 ABCD) 做 循环 移 位 (rotate) 所 能 得 到 的 所 有 
字符 串 ， 看 其 结果 是 否 与 s, 相等 。 若 字符 串 的 长 度 N 较 大 ， 显 然 效 率 很 
低 。 

【解法 二 】 
我 们 也 可 以 对 循环 移 位 之 后 的 结果 进行 分 析 。 


以 s1 二 ABCD 为 例 ， 先 分 析 对 si 进行 循环 移 位 之 后 的 结果 ， 如 下 所 


ABCD-~BCDA-CDAB-~DABC-ABCD... 

假设 我 们 把 前 面 移 走 的 数据 进行 保留 ， 会 发 现 有 如 下 的 规律 : 

ABCD—> ABCDA > ABCDAB >» ABCDABC >» ABCDABCD 

因此 ， 可 以 看 出 对 sj 做 循环 移 位 (rotate) 所 得 到 的 字符 串 都 将 是 
字符 串 s; si 的 子 字符 串 。 如 果 s, 可 以 由 sj 循环 移 位 (rotate) 得 到 ， 那 
么 s, 一 定 在 s; s; 上 。 至 此 我 们 将 问题 转换 成 考察 s, 是 否 在 s1 s1 上 ， 可 
通过 调用 一 次 strstr2 国 数 得 到 结果 。 

例如 若 CDAB 在 ABCDABCD 上 可 以 找到 ， 那 么 CDAB 也 可 通过 
ABCD 做 循环 移 位 得 到 (ABCD 循 环 左 移 或 循环 右 移 两 位 ) 。 


总 结 
第 二 种 方法 利用 了 “提高 空间 复杂 度 来 换取 时 间 复 杂 度 的 降低 ”的 
思路 ， 适 用 于 对 时 间 复 杂 度 要 求 高 的 场合 。 


3.2 ”电话 号 码 对 应 类 语 单词 


电话 的 号 码 盘 一 般 可 以 用 于 输入 字母 。 如 用 2 可 以 输入 A、B、C， 
用 3 可 以 输入 D、E、F 等 。 如 图 3-1 所 示 : 


图 3-1 “手机 按键 示意 图 


对 于 号 码 5869872， 可 以 依次 输出 其 代表 的 所 有 字母 组 合 。 如 : 
JTIMWTPA、 JTIMWITPB...... 

1. 您 是 否 可 以 根据 这 样 的 对 应 关系 设计 一 个 程序 ， 尽 可 能 快 地 从 
这 些 字 母 组 合 中 找到 一 个 有 意义 的 单词 来 表述 一 个 电话 号 码 呢 ? 如 : 
可 以 用 单词 “computer” 来 描述 号 码 26678837。 

2. 对 于 一 个 电话 号 码 ， 是 否 可 以 用 一 个 单词 来 代表 呢 ? 怎样 才 是 
最 快 的 方法 呢 ? 显然 ， 肯 定 不 是 所 有 的 电话 号 码 都 能 够 对 应 到 单词 上 
去 。 但 是 根据 问题 1 的 解答 ， 思 路 相对 就 会 比较 清晰 。 

分 析 与 解法 

对 于 题目 1， 不 妨 掏 出 手机 或 寻找 身边 的 电话 来 进行 研究 ， 相 信 我 
们 很 快 就 能 够 找 出 规律 。 可 以 发 现 除 了 0、1 之 外 ， 其 他 数字 上 都 最 少 
有 3 个 字符 ， 其 中 7、9 上 有 4 个 字符 ， 我 们 假设 0、1 输 出 的 是 空 字符 。 

首先 将 问题 简单 化 。 若 电话 号 码 只 有 一 位 数 ， 比 如 说 4， 那 么 其 代 
表 的 “单词 ”为 G、H、I， 据 此 可 以 画 出 一 棵 排列 树 ， 如 图 3-2 所 示 : 


图 3-2 ”排列 树 示意 图 


接着 若 电话 号 码 升级 到 两 位 数 (比如 42) ， 又 将 如 何 呢 ? 分 两 步 
走 ， 从 左 到 右 ， 在 选择 一 个 第 一 位 数字 所 代表 的 字符 的 基础 上 ， 遍 历 
第 二 位 数字 所 代表 的 字符 ， 直 到 遍历 完 第 一 位 数字 代表 的 所 有 字符 。 
就 拿 42 来 说 ，4 所 能 代表 的 字符 为 (G，H，D ，2 所 能 代表 的 字符 为 

(A，B，C) ， 首 先 让 4 代表 G， 接 着 遍历 2 所 能 代表 的 所 有 字符 ， 即 可 
得 到 GA、GB、GC; 然后 再 让 4 代表 H， 再 次 遍历 2 所 能 代表 的 所 有 字 
符 ， 可 得 到 HA、HB、HC; 最 后 让 4 代表 1， 那么 同 理 可 得 到 IA、IB、 
IC。 

同样 ， 可 以 在 4 所 表示 的 排列 树 的 基础 上 ， 进 一 步 画 出 42 所 表示 的 
排列 树 ， 如 图 3-3 所 示 : 


42 
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图 3-3 ”多 个 数字 的 排列 树 示意 图 


聪明 的 读者 可 能 已 经 发 现 ， 通 过 遍历 这 棵 排列 树 所 有 叶子 节点 而 
得 到 的 所 有 路 径 的 集合 ， 即 为 42 所 能 代表 的 所 有 “单词 ”的 集合 。 

那么 现在 无 论 电话 号 码 的 位 数 如 何 升级 ， 相 信 大 家 都 能 够 构造 出 
相应 的 排列 树 ， 从 而 可 以 简单 地 通过 遍历 所 有 的 叶子 节点 ， 得 到 其 所 
代表 的 “单词 ”集合 。 

通过 分 析 ， 下 面 要 做 的 就 是 如 何人 遍历 得 到 一 个 电话 号 码 所 能 代表 
的 “单词 ”集合 。 
【问题 1 的 解法 一 】 直接 循 环 法 

将 各 个 数字 所 能 代表 的 字符 存储 在 一 个 二 维 数 组 中 ， 其 中 假设 0、 
1 所 代表 的 字符 为 空 字符 。 
代码 清单 3-2 


并 将 各 个 数字 所 能 代表 的 字符 总 数 记录 于 另 一 个 数组 中 : 

int total[10]={0, 0, 3, 3, 3, 3, 3,， 4，3，4}; 

用 一 个 数组 存储 电话 号 码 : 

int number[TelLength]; //TelLength 为 电话 号 码 的 位 数 

将 数字 目前 所 代表 的 字符 在 其 所 能 代表 的 字符 集中 的 位 置 用 一 个 
数组 储存 起 来 : 

int answer[TelLength]; //TelLength 为 电话 号 码 的 位 数 ， 初 始 化 时 
answer[jj 三 0. 

举 个 例子 ， 若 Number[0] 二 4， 即 电话 号 码 的 第 一 位 为 4， 若 
answer[0] 二 2， 即 4 目前 所 代表 的 字符 为 : 

cIlnumber[0]][answer[0]]=c[4][2]= "1"'。 

假设 电话 号 码 只 有 三 位 ， 那 么 可 能 会 有 人 很 快 写 出 3 个 for 循 环 来 。 
代码 清单 3-3 


for (answer[{[0] = 0; answer[0] < total [number [0]];y answer[0]++) 


的 确 ， 针 对 3 位 的 电话 号 码 ， 此 3 个 for 循 环 可 以 很 好 地 解决 问题 (n 
位 的 电话 号 码 ， 则 需要 n 个 for 循 环 ) ， 但 是 不 同 地 区 的 电话 号 码 位 数 不 
同 ， 而 且 若 是 电话 号 码 位 数 升级 了 呢 ? 我 们 就 需要 修改 源 代码 去 增加 


若干 个 for 循 环 ， 这 是 一 件 很 痛苦 的 事情 ， 而 且 也 实在 体现 不 出 编程 之 
“ 美 " 来 ， 其 实 对 程序 进行 简单 修改 ， 即 可 解决 这 样 的 扩展 性 问题 。 
代码 清单 3-4 


INnlile (true) 


If{(Kk < )) 
break; 


【问题 1 的 解法 二 】 递归 的 方法 
循环 的 方法 固然 简单 ， 如 果 要 求 使 用 递归 ， 又 该 如 何 解决 呢 ? 其 
实 可 以 从 循环 算法 中 那些 被 我 们 批判 的 n 个 for 循 环 方法 中 得 到 提示 ， 每 


层 的 for 循 环 ， 其 实 可 以 看 成 一 个 递归 函 数 的 调用 。 
代码 清单 3-5 


其 中 number[] 和 answer[] 的 含义 同上 ，number[] 用 于 存放 电话 号 
码 ，answer[] 则 用 于 存放 对 应 数字 目前 所 代表 的 字符 在 其 所 能 代表 的 字 
符 集 中 的 位 置 ，index 则 说 明 对 电话 号 码 的 第 几 位 进行 循环 ，n 为 电话 号 
码 的 位 数 。 那 么 递归 的 初始 调用 为 RecursiveSearch (number，answer， 
0, n) 。 


【问题 2 的 解法 一 】 

利用 问题 1 的 算法 ， 把 该 电话 号 码 所 对 应 的 字符 全 部 计算 出 来 ， 然 
后 去 匹配 字典 ， 判 断 是 否 有 答案 。 

【问题 2 的 解法 二 】 

如 果 查 询 的 次 数 较 多 ， 可 直接 把 字典 里 面 的 所 有 单词 都 按照 这 种 
转换 规则 转换 为 数字 ， 并 存 到 文件 中 ， 使 之 成 为 另 一 本 数字 字典 。 然 
后 ， 通 过 对 这 个 电话 号 码 查 表 的 方式 来 得 到 结果 。 事 实 上 这 已 经 有 相 
应 的 Web 应 用 出 现 了 ， 网 站 服务 器 中 存放 着 经 过 转换 的 数字 字典 ， 客 户 
端 通过 浏览 器 就 可 以 很 方便 快捷 地 进行 查询 。 但 若 查询 的 次 数 较 少 ， 
比如 只 在 Client 查 一 两 次 ， 那 么 翻译 整 本 数字 字典 就 不 值得 了 。 


3.3 ”计算 字符 串 的 相似 度 


许多 程序 会 大 量 使 用 字符 串 。 对 于 不 同 的 字符 串 ， 我 们 希望 能 够 
有 办 法 判断 其 相似 程度 。 我 们 定义 了 一 套 操作 方法 来 把 两 个 不 相同 的 
字符 串 变 得 相同 ， 有 具体 的 操作 方法 为 : 

1. 修改 一 个 字符 (如 把 “a”* 替 换 为 “<b”) 。 

2. 增加 一 个 字符 (如 把 “abdd” 变 为 “aebdd”) 。 

3. 删除 一 个 字符 (如 把 “travelling” 变 为 “traveling”) 。 

比如 ， 对 于 “abcdefg” 和 “abcdef”" 两 个 字符 串 来 说 ， 我 们 认为 可 以 通 
过 增加 减少 一 个 “g” 的 方式 来 达到 目的 。 上 面 的 两 种 方案 ， 都 仅 需 要 
一 次 操作 。 把 这 个 操作 所 需要 的 次 数 定义 为 两 个 字符 串 的 距离 ， 而 相 
似 度 等 于 “距离 十 1” 的 倒数 。 也 就 是 说 ，“abcdefg” 和 “abcdef” 的 距离 为 
1， 相 似 度 为 112 三 0.5。 

给 定 任意 两 个 字符 串 ， 你 是 否 能 写 出 一 个 算法 来 计算 出 它们 的 相 
似 度 呢 ? 
分 析 与 解法 

不 难看 出 ， 两 个 字符 串 的 距离 肯定 不 超过 它们 的 长 度 之 和 (我们 
可 以 通过 删除 操作 把 两 个 串 都 转化 为 空 串 ) 。 虽 然 这 个 结论 对 结果 没 
有 帮助 ， 但 至 少 可 以 知道 ， 任 意 两 个 字符 串 的 距离 都 是 有 限 的 。 

我 们 还 是 应 该 集中 考虑 如 何 才 能 把 这 个 问题 转化 成 规模 较 小 的 同 
样 的 问题 。 如 果 有 两 个 串 A 二 xabcdae 和 B= 二 xfdfa， 它 们 的 第 一 个 字符 是 
相同 的 ， 只 要 计算 A[2，...，7] 二 abcdae 和 B[2，...，5] 二 fdfa 的 距离 就 
可 以 了 。 但 是 如 果 两 个 串 的 第 一 个 字符 不 相同 ， 那 么 可 以 进行 如 下 的 
操作 〈lenA 和 lenB 分 别 是 A 串 和 B 串 的 长 度 ) : 

1. 删除 A 串 的 第 一 个 字符， 然后 计算 A[2，.…，lenA] 和 B[1，.…， 
lenB] 的 距离 。 

2. 删除 B 串 的 第 一 个 字符 ， 然 后 计算 ALL1，.…，lenA] 和 B[2，.…， 
lenB] 的 距离 。 


3. 修改 A 串 的 第 一 个 字符 为 B 串 的 第 一 个 字符 ， 
...，]lenB] 的 距离 。 

4. 修改 B 串 的 第 一 个 字符 为 A 串 的 第 一 个 字符 ， 
...，]enB] 的 距离 。 

5. 增加 B 串 的 第 一 个 字符 到 A 串 的 第 一 个 字符 之 前 ， 
...，]enB] 的 距离 。 

6. 增加 A 串 的 第 一 个 字符 到 B 串 的 第 一 个 字符 之 前 ， 
...，]enB] 的 距离 。 

个 题目 中 ， 我 们 并 不 在 乎 两 个 字符 串 变 得 相等 之 后 的 字符 串 


A[2，...，lenA] 和 BT2， 


A[2，...，lenA] 和 BT2， 


A[1，...，lenA] 和 BT2， 


A[2，...，lenA] 和 BT1， 


在 这 


然后 计算 


然后 计算 


然后 计算 


然后 计算 


是 怎样 的 。 所 以 ， 可 以 将 上 面 6 个 操作 合并 为 : 


1. 一 步 操 作 之 后 ， 再 将 A[2， 
同 字符 串 。 

2. 一 步 操作 之 后 ， 再 将 A[1， 
同 字 符 串 。 

3. 一 步 操作 之 后 ， 再 将 A[2， 


[ps AL 


司 字符 串 。 


...，lenA] 和 B[1，...，lenB] 变 成 相 


...，lenA] 和 B[2，...，lenB] 变 成 相 


...，lenA] 和 B[2，...，lenB] 变 成 相 


这 样 ， 很 快 就 可 以 完成 一 个 递归 程序 : 


代码 清单 3-6 


Int CalculateStringDistance(string strA, int pABegin, int pAEnd, 


int pBBegin, int pBEnd) 
{ 
If (pABegin > pAEnd) 
{ 
if(pBBegin > pBEnd) 
return 0; 


else 


return pBEnd -~ pBBegin + 1; 


if (pPBBegin > pBEnd) 
{ 
if (pABegin > pAEnd) 
return 0; 
else 
return pAEnd 一 pABegin + 1; 


if (strA[pABegin] == strB[pBBegin])) 
{ 


return CalculateStringDistance (strA, pABegin + 


pBBegin + 1, pBEnd); 


else 


int tl = CalculatesStringDistance(strA, pABegin + 1, 


PpBBegin + 2, pBEnd); 


int t2 = CalculateStringDistance(strA, pABegin + 2， 


PBBegin + 1, pBEnd); 


int t3 = CalculateStringDistance (strA, pABegin + 2, 


pBBegin + 2, pBEnd); 
return minValue (tl,t2,t3) + 1; 


string strB, 


pAEnd, strB, 


pAEnd, strB, 
PAEnd, strB, 


pAEnd, strB, 


上 面 的 递归 程序 ， 有 什么 地 方 需要 改进 呢 ? 在 递归 的 过 程 中 ， 有 


些 数 据 被 重复 计算 了 。 比 如 ， 如 果 开 始 我 们 调用 


CalculateStringDistance(strA，1，2，strB，1，2)， 图 3-4 是 部 分 展开 的 


递归 调用 : 


(strk, 1, 2, strB, 1, 2) 


(strA, 1, 2, strB, 2,2) (strA,2,2, strB, 1, 2) Ctrh, 2, 2, strB, 2, 37 


WN\ 


(strA, 1, 2, strB, 3, 2) 
(strA, 2, 2, strB, 3, 2) 
strA, 2,2, strB, 2,2 


图 3-4 


可 以 看 到 ， 圈 中 的 两 个 子 问题 被 重复 计算 了 。 为 了 避免 这 种 不 必 
要 的 重复 计算 ， 可 以 把 子 问题 计算 后 的 解 存 储 起 来 。 如 何 修改 递归 程 
序 呢 ? 这 个 问题 就 留 给 读者 自己 完成 吧 ! 


3.4 ”从 无 头 单 链表 中 删除 节 扣 


假设 有 一 个 没有 头 指针 的 单 链 表 。 一 个 指针 指向 此 单 链 表 中 间 的 
一 个 节点 〈 不 是 第 一 个 ， 也 不 是 最 后 一 个 节点 ) ， 请 将 该 节点 从 单 链 
表 中 删除 。 

[解法 一 】 

假设 给 定 的 指针 为 pCurrent，Node*pNext 二 pCurrent Next (pNext 
和 向 pCurrent 所 指 节点 的 下 一 个 节点 ) 。 

根据 题 意 ，pCurrent 指 向 链表 的 某 一 个 节点 (除了 最 后 一 个 节 
点 ) ， 即 pCurrent 指 向 中 间 节 点 ， 那 么 此 时 pCurrent 一 NextzNULL。 

若 pCurrent 指 向 链表 中 间 节 点 的 某 个 节点 B， 如 图 3-5 所 示 ， 则 需要 
删 掉 B， 使 得 A 和 C 相 连 ， 如 图 3-6 所 示 。 删 掉 B 容 易 ， 但 是 单 链 表 节 点 
并 没有 头 指 针 ， 因 此 无 法 奶 关 到 A， 也 就 无 法 将 A 和 C 相 连 。 


人 


pCurrent pNext 
图 3-5 链 表示 意图 


(3 —Ae) A 


图 3-6 删除 之 后 链表 示意 图 


重新 考察 所 拥有 的 条 件 一 一 尾 指 针 ， 我 们 由 pCurrent 指 向 B，pNext 
(pCurrent ~ Next) 指向 C， 同 理 pNext -~ Next 
(pCurrent 一 Next 一 Next) 指向 D， 不 过 不 能 简单 地 删除 B， 因 为 那样 会 
使 得 链表 被 分 割 。 但 是 我 们 可 以 删除 C， 并 通过 pCurrent Next 二 
pCurrent 一 Next 一 Next 重 新 使 链表 连接 ， 其 中 唯一 丢失 的 是 C 中 的 data 


项 。 那 么 就 让 我 们 来 上 演 一 出 算法 版 的 “狸猫 换 太 子 ”， 将 C 中 的 数据 取 
代 B 中 的 数据 项 ， 让 B 摇 身 一 变 成 为 C， 然 后 将 真正 指向 C 的 指针 删除 ， 
这 样 我 们 就 达到 了 目的 ， 代 码 如 下 : 

pCurrent -> Next = pNext -> Next,; 


pCurrent -> Data = pNext 一 > Data; 
delete pNext; 


附 完整 代码 : 
代码 清单 3-7 


扩展 问题 


编 瑟 一 个 水 数 ， 给 定 一 个 链表 的 头 指针 ， 要 求 只 遍历 一 次 ， 将 单 
链表 中 的 元 素 顺序 反 转 过 来 。 


总 结 
很 多 对 C 语 言 不 熟悉 的 同学 比较 害怕 指针 的 题目 ， 其 实 指针 不 过 是 


内 存 中 的 地 址 而 已 。 在 处 理 这 类 题目 时 ， 先 画 出 清晰 的 图 表 会 很 有 帮 
助 。 


3.5 ”最短 摘要 的 生成 


互联 网 搜索 已 经 成 为 了 大 家 工作 和 生活 的 一 部 分 。 在 输入 一 些 天 
键 词 之 后 ， 搜 索引 擎 会 返回 许多 结果 ， 每 个 结果 都 包含 一 段 概括 网 页 
内 容 的 摘要 。 例 如 ， 在 www.live.com 中 搜索 “微软 亚洲 研究 院 使 命 "， 第 
一 个 结果 是 微软 亚洲 研究 院 的 首页 ， 如 图 3-7 所 示 。 

在 搜索 结果 中 ， 标 题 和 URL 之 间 的 内 容 就 是 我 们 所 说 的 摘要 : 


微软 亚 潮 研 究 院 使 命 | Search | 
Web results 1- 
See also: Images, Vi 
微软 亚洲 研究 院 
欢迎 光临 微软 亚洲 研究 院 首页 .… 微软 亚洲 研究 院 成 立 于 1998 年 ;我 们 的 使 命 
是 使 未 来 的 计算 机 能 够 看 、 听 、 学 ， 能 用 自然 语言 与 人 类 进行 ... 


research.microsoft. com/asia .Cachedpaqe . Translate this page 


f 


nn 
UU 
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deo, News, Maps, MSN, More 


图 3-7 搜索 引擎 中 的 最 短 摘要 


这 些 最 短 摘要 是 怎样 生成 的 呢 ? 可 以 对 问题 进行 如 下 的 简化 : 

假设 给 定 的 已 经 是 经 过 网 页 分 词 之 后 的 结果 ， 词 语序 列 数组 为 
We。 其 中 WwW[0]，W[H，.…，W[N] 为 一 些 已 经 分 好 的 词语 。 

假设 用 户 输入 的 搜索 关键 词 为 数组 Q。 其 中 Q[0]，Q[1]，...，Q[m] 
为 所 有 输入 的 搜索 关键 词 。 

这 样 ， 生 成 的 最 短 摘要 实际 上 就 是 一 串 相互 联系 的 分 词 序 列 。 比 
如 从 WI[] 到 W[j]， 其 中 ，0 过 i<j 过 二 N。 例 如 图 3-7 中 ,，“ 欢 迎 光临 微软 
亚洲 研究 院 首 页 ”包含 了 所 有 的 关键 字 一 一 “微软 亚洲 研究 院 使 命 ”。 


分 析 与 解法 
【解法 一 】 

在 分 析 问 题 之 前 ， 先 通过 一 个 实际 的 例子 来 探讨 。 比 如 在 微软 亚 
洲 研 究 院 的 主页 上 ， 有 这 么 一 段 话 : 


“微软 亚洲 研究 院 成 立 于 1998 年 ， 我 们 的 使 命 是 使 未 来 的 计算 机 能 
够 看 、 听 、 学 ， 能 用 自然 语言 与 人 类 进行 交流 。 在 此 基础 上 ， 微 软 亚 
洲 研究 院 还 将 促进 计算 机 在 亚太 地 区 的 普及 ， 改 善 亚太 用 户 的 计算 体 
验 。” 

那么 ， 我 们 可 以 猜想 一 下 可 能 的 分 词 结果 就 是 : 

“微软 一 亚洲 二 研究 院 二 成 立 了 于 /1998 一 年 一 ， 二 我 们 二 的 一 使 命 
了 是 一 使 了 未 来 了 的 一 计算 机 二 能够 了 看、 一 听 、 二 学， 一 能 
了 用 自然 语言 A 与 人 类 进行 交流。 在 此 基础 上 
了 ， 二 微软 二 亚洲 了 研究 院 一 还 一 将 一 促进 一 计算 机 二 在 了 亚太 一 地 
区 二 的 一 普及 一 ， 一 改善 了 亚太 二 用户 一 的 一 计算 一 体验。 

这 也 就 是 我 们 期 望 的 W 数 组 序列 。 

那么 ， 我 们 可 以 看 看 这 样 的 一 个 序列 : 


WO,wl,w2,w3,9q0,w4,w5,ql,w6,w7,w8,90,w9,ql 
t + t 


看 了 如 上 的 序列 之 后 ， 相 信 大 家 一 定 找到 一 些 解 题 思路 了 吧 : 

1. 从 WwW 数 组 的 第 一 个 位 置 开 始 查找 出 一 段 包 含 所 有 关键 词 数组 Q 
的 序列 。 计 算 当 前 的 最 短 长 度 ， 并 更 新 Seq 数 组 。 

2. 对 目标 数组 W 进 行 遍历 ， 从 第 二 个 位 置 开始 ， 重 新 查找 包含 所 
有 关键 词 数组 Q 的 序列 ， 同 样 计算 出 其 最 短 长 度 ， 以 及 更 新 包含 所 有 关 
键 词 的 序列 Seq， 然 后 求 出 最 短 距 离 。 

3. 依次 操作 下 去 ， 一 直到 遍历 至 目标 数组 W 的 最 后 一 个 位 置 为 
Is 

那么 ， 这 个 算法 的 时 间 复杂 度 如何 呢 ? 

首先 ， 要 遍历 所 有 其 他 的 关键 词 (M) ， 对 于 每 个 关键 词 ， 要 遍 
历 整个 网 页 的 词 (N) ， 而 每 个 关键 词 在 整个 网 页 中 的 每 一 次 出 现 ， 要 
遍历 所 有 的 Seq， 以 更 新 这 个 关键 词 与 所 有 其 他 关键 词 的 最 小 距离 。 

所 以 算法 复杂 度 为 : O(N?*M) 。 
【解法 二 】 

前 面 的 时 间 复 杂 度 这 么 高 ， 我 们 是 否 有 办 法 降低 呢 ? 


相信 你 一 定 注意 到 了 ， 进 行 查找 的 时 候 ， 总 是 重复 地 循环 ， 效 率 
不 高 。 那 么 怎么 简化 呢 ? 还 是 来 看 看 这 些 序列 : 
WO,wl,w2,w3,q0,w4,w5,ql,w6,w7i,w8,q0,w9,ql 
t t 1 t 


问题 在 于 ， 如 何 一 次 把 所 有 的 关键 词 都 扫描 到 ， 并 且 不 遗漏 。 扫 
昔 肯 定 是 无 法 避免 的 ， 但 是 如 何 把 两 次 扫描 的 结果 联系 起 来 呢 ? 这 是 
一 个 值得 考虑 的 问题 。 

沿用 前 面 的 扫描 方法 ， 再 来 看 看 : 

第 一 次 扫描 的 时 候 ， 假 设 需要 包含 所 有 的 关键 词 ， 将 得 到 如 下 的 
结果 : 


WO, wl,w2,w3,90, w4,w5, ql,w6,w7i,w8,q0,w9,dql 
t 


| 
那么 ， 下 次 扫描 应 该 怎么 办 呢 ? 显然， 我 们 可 以 把 第 一 个 被 扫描 
的 位 置 挪 到 q0 处 。 


WO,wl,w2,w3,q0,w4,w5,ql,w6,wi,w8,90,w9,9gl 


t 


如 果 把 第 一 个 被 扫描 的 位 置 继续 往 后 面 移动 一 格 ， 这 样 包含 的 序 
列 中 将 减少 了 关键 词 d0。 那 么 ， 如 果 我 们 把 第 二 个 扫描 位 置 往 后 移 ， 
这 样 就 可 以 找到 下 一 个 包含 所 有 关键 词 的 序列 。 如 下 : 


WO,wl,w2,w3,90, Ww4,w5,ql,w6,w7i,w8,q0,w9,9ql 
t 1 


这 样 ， 问 题 就 和 第 一 次 扫描 时 碰 到 的 情况 一 样 了 。 依 次 扫描 下 
去 ， 在 w 中 找 出 所 有 包含 q 的 序列 ， 并 且 找 出 其 中 的 最 小 值 ， 就 可 得 到 
最 终 的 结果 。 

示例 代码 如 下 所 示 : 
代码 清单 3-8 


int nTargetLen 时 1/ 设置 目标 长 度 为 总 长 度 +1 


nt pBegin = 0; // 初始 指针 
Int PEnd Ds; // 结束 指 旬 
t nLen = N; // 目标 数组 的 长 度 为 N 
nt nAbstractBegqin = 0; f 目标 摘要 的 起 始 地 埋 
t nAbstractBegin 0; // 目标 摘要 的 结束 地 夫 
[ (true) 


/ 假设 包含 所 有 的 关键 词 ， 并 且 后 面 的 指针 没有 越界 ， 往 后 移动 指针 


while(!isAllExisted() && pEnd < nLen) 


pEnd++; 


/ 假设 找到 一 段 包 含 所 有 关键 词 信息 的 字符 串 


while(isAllExistedt{)) 


if (pEnd PpBegin < nlargetLen) 
iTargetl = PEnQ PpBegi 
A 1 gin = ] 
\ ctEnd = pEnd 


小 结 


在 上 面 的 分 析 中 ， 我 们 首先 简化 和 抽象 了 问题 ， 使 之 变 成 了 一 个 
容易 理解 的 字符 串 匹 配 的 问题 。 然 后 ， 在 最 简单 的 算法 的 基础 之 上 ， 
找 出 可 能 的 简化 方案 ， 进 而 降低 算法 的 复杂 度 。 

在 实际 的 面试 中 ， 面 试 者 并 没有 期 望 应 聘 者 第 一 次 就 能 够 给 出 最 
佳 的 解决 方案 。 如 果 应 聘 者 能 够 不 断 地 深入 分 析 问 题 ， 逐 步 找 出 更 加 
可 行 的 方案 ， 将 能 够 获得 面试 者 的 认可 。 


3.6 ”编程 判断 两 个 链表 是 否 相交 


给 出 两 个 单 向 链表 的 头 指针 (如 图 3-8 所 示 ) ， 比 如 hi 、hz ， 判 断 
这 两 个 链表 是 否 相 交 。 这 里 为 了 简化 问题 ， 我 们 假设 两 个 链表 均 不 带 
环 。 


和 和 和 
LL 
时 > 有 » >» NULL 
” 
> 5 
图 3-8 ”链表 相交 示意 图 
分 析 与 解法 


这 样 的 一 个 问题 ， 也 许 我 们 平时 很 少 考虑 。 但 在 一 个 大 的 系统 
中 ， 如 果 出 现 两 个 链表 相交 的 情况 ， 而 且 释 放 了 其 中 一 个 链表 的 所 有 
节点 ， 那 样 就 会 造成 信息 的 丢失 ， 并 且 另 一 个 与 之 相交 的 链表 也 会 受 
到 影响 ， 这 是 我 们 不 希望 看 到 的 。 在 特殊 的 情况 下 ， 的 确 需 要 出 现 相 
交 的 两 个 链表 ， 我 们 希望 在 释放 一 个 链表 之 前 知道 是 否 有 其 他 链表 跟 
当前 这 个 链表 相交 。 

[解法 一 】 直 观 的 想法 

看 到 这 个 问题 ， 我 们 的 第 一 个 想法 估计 都 是 , “不 管 三 七 二 十 
一 ”， 先 判断 第 一 个 链表 的 每 个 节点 是 否 在 第 二 个 链表 中 。 这 种 方法 的 
时 间 | 复杂 度 为 O(Length(hi )*Length(h, ))。 可 见 ， 这 种 方法 很 耗 时 间 。 


【解法 二 】 利 用 计数 的 方法 
很 容易 想到 ， 如 果 两 个 链表 相交 ， 那 么 这 两 个 链表 就 会 有 共同 的 
节点 。 而 节点 地 址 又 是 节 点 的 唯一 标识 。 所 以 ， 如 果 我 们 能 够 判断 两 


个 链表 中 是 否 存在 地 址 一 致 的 节点 ， 就 可 以 知道 这 两 个 链表 是 否 相 
交 。 一 个 简单 的 做 法 是 对 第 一 个 链表 的 节点 地 址 进行 hash 排 序 ， 建 立 
hash 表 ， 然 后 针对 第 二 个 链表 的 每 个 节点 的 地 址 查询 hash 表 ， 如 果 它 在 
hash 表 中 出 现 ， 那 么 说 明 第 二 个 链表 和 第 一 个 链表 有 共同 的 节点 。 这 个 
方法 的 时 间 复 杂 度 为 O(max(Length(hi ) 十 Length(h, )))。 但 是 它 同时 需 
要 附加 O(Length(hi )) 的 存储 空间 ， 以 存储 哈 希 表 。 虽 然 这 样 做 减少 了 
时 间 复 杂 度 ， 但 是 是 以 增加 存储 空间 为 代价 的 。 是 否 还 有 更 好 的 方法 
呢 ， 既 能 够 以 线性 时 间 复 杂 度 解决 问题 ， 又 能 减少 存储 空间 ? 
[解法 三 】 

由 于 两 个 链表 都 没有 环 ， 我 们 可 以 把 第 二 个 链表 接 在 第 一 个 链表 
后 面 ， 如 果 得 到 的 链表 有 环 ， 则 说 明 这 两 个 链表 相交 。 人 否则 ， 这 两 个 
链表 不 相交 (如 图 3-9 所 示 ) 。 这 样 我 们 就 把 问题 转化 为 判断 一 个 链表 
是 否 有 环 。 


» 六 量 硬 看 » 


图 3-9 ”链表 有 环 的 情况 


判断 一 个 链表 是 否 有 环 ， 也 不 是 一 个 简单 的 问题 ， 但 是 需要 注意 
的 是 ， 在 这 里 如 果 有 环 ， 则 第 二 个 链表 的 表 头 一 定 在 环 上 ， 我 们 只 需 
要 从 第 二 个 链表 开始 遍历 ， 看 是 否 会 回 到 起 始点 就 可 以 判断 出 来 。 最 
后 ， 当 然 可 别 迄 了 恢复 原来 的 状态 ， 去 挤 从 第 一 个 链表 到 第 二 个 链表 
表 头 的 指向 。 

这 个 方法 总 的 时 间 复 杂 度 也 是 线性 的 ， 但 只 需要 常数 的 空间 。 


【解法 四 】 


仔细 观察 题目 中 的 图 示 ， 如 果 两 个 没有 环 的 链表 相交 于 某 一 节点 
的 话 ， 那 么 在 这 个 节点 之 后 的 所 有 节点 都 是 两 个 链表 所 共有 的 。 那 么 
我 们 能 否 利用 这 个 特点 简化 我 们 的 解法 呢 ? 困难 在 于 我 们 并 不 知道 哪 
个 节点 必定 是 两 个 链表 共有 的 节点 (如 果 它 们 相交 的 话 ) 。 进 一 步 考 
虑 “如 果 两 个 没有 环 的 链表 相交 于 某 一 节点 的 话 ， 那 么 在 这 个 节点 之 后 
的 所 有 节点 都 是 两 个 链表 共有 的 ”这 个 特点 ， 我 们 可 以 知道 ， 如 果 它 们 
相交 ， 则 最 后 一 个 节点 一 定 是 共有 的 。 而 我 们 很 容易 能 得 到 链表 的 最 
后 一 个 节点 ， 所 以 这 成 了 我 们 简化 解法 的 一 个 主要 突破 口 。 

先 遍 历 第 一 个 链表 ， 记 住 最 后 一 个 节点 。 然 后 遍历 第 二 个 链表 ， 
到 最 后 一 个 节点 时 和 第 一 个 链表 的 最 后 一 个 节点 做 比较 ， 如 果 相 同 ， 
则 相交 ， 否 则 ， 不 相交 。 这 样 我 们 就 得 到 了 一 个 时 间 复 杂 度 ， 它 为 
O((Length(hi ) 十 Length(h, ))， 而 且 只 用 了 一 个 额外 的 指针 来 存储 最 后 
一 个 节点 。 这 个 方法 比 解法 三 更 胜 一 筹 。 
扩展 问题 


1. 如 果 链 表 可 能 有 环 呢 ? 上 面 的 方法 需要 怎么 调整 ? 
2. 如 果 我 们 需要 求 出 两 个 链表 相交 的 第 一 个 节点 呢 ? 


3.7 ”队列 中 取 最 大 值 操作 问题 


假设 有 这 样 一 个 拥有 三 个 操作 的 队列 : 

1. EnQueue(V): 将 v 加 入 队列 中 

2. DeQueue: 使 队列 中 的 队 首 元 素 删除 并 返回 此 元 素 

3. MaxElement: 返回 队列 中 的 最 大 元 素 

请 设计 一 种 数据 结构 和 算法 ， 让 MaxElement 操 作 的 时 间 复 杂 度 尽 
可 能 地 低 。 
分 析 与 解法 

【解法 一 】 

这 个 问题 的 关键 在 于 取 最 大 值 的 操作 ， 并 且 得 考虑 当 队 列 里 面 的 
元 素 动态 增加 和 减少 的 时 候 ， 如 何 能 够 非常 快速 地 把 最 大 值 取 出 。 

显然 ， 最 直接 的 思路 就 是 按 传统 方式 来 实现 队列 : 利用 一 个 数组 
或 链表 来 存储 队列 的 元 素 ， 利 用 两 个 指针 分 别 指向 队列 的 队 首 和 队 
尾 。 如 果 采 用 这 种 方法 ， 那 么 MaxFElement 操 作 需 要 遍历 队列 的 所 有 元 
素 。 在 队列 的 长 度 为 N 的 条 件 下 ， 时 间 复 杂 度 为 O (N) 。 

注 : 小 飞 看 到 这 里 时 心 想 ， 在 解法 一 的 基础 上 ， 我 们 按照 空间 换 
时 间 的 思路 ， 多 设置 一 个 变量 MaxVal， 每 入 队 一 个 元 素 ， 就 更 新 一 下 
MaxVal， 使 MaxVal 总 保存 着 队列 中 最 大 的 元 素 。 这 样 ，MaxElement 子 
数 只 需要 返回 MaxVal 的 值 就 可 以 了 ， 这 就 实现 了 一 种 时 间 复 杂 度 为 O 
(1) 的 算法 。 想 到 这 些 ， 小 飞 感到 很 高 兴 。 

你 觉得 小 飞 的 想法 对 吗 ? 
【解法 二 】 

队列 是 遵守 <“ 先入 先 出 ”原则 的 一 种 复杂 数据 结构 。 其 底层 的 数据 


结构 不 一 定 要 用 数组 来 实现 ， 还 可 以 使 用 其 他 特殊 的 数据 结构 来 实 
现 ， 以 达到 降低 MaxElement 操 作 复杂 度 的 目的 。 


根据 取 最 大 值 的 要 求 ， 可 以 考虑 用 最 大 堆 来 维护 队列 中 的 元 素 。 
堆 中 每 个 元 素 都 有 指针 指向 它 的 后 续 元 素 。 这 样 ， 堆 就 可 以 很 快 实现 
返回 最 大 元 素 的 操作 。 同 时 ， 我 们 也 能 保证 队列 的 正常 插入 和 删除 。 
MaxElement 操 作 其 实 就 是 维护 一 个 最 大 堆 ， 其 时 间 复 杂 度 为 O (1) 。 
而 入 队 和 出 队 操 作 的 时 间 复 杂 度 为 O (log, N) 。 

图 3-10 为 这 种 解法 的 示意 图 。 其 中 实 线 为 普通 最 大 堆 的 示意 图 ， 从 
中 可 以 看 出 子 节点 都 比 父 节点 的 值 小 。 而 箭头 表示 指针 ， 节 点 用 以 描 
述 插入 队列 的 先后 顺序 。 


0 


图 3-10 ”最 大 堆 示意 图 

【解法 三 】 

还 能 做 得 更 好 些 吗 ? 让 我 们 再 回忆 一 下 解法 二 。 其 实 ， 抽 象 一 些 
地 说 ， 解 法 二 之 所 以 求 最 大 值 操作 的 速度 比 解法 一 快 ， 是 因为 它 利用 
一 个 指针 集合 保持 了 队列 中 元 素 的 相对 大 小 关系 。 所 以 返回 最 大 值 只 
需要 O (1) 的 时 间 复 杂 度 ， 而 在 元 素 入 队 或 出 队 时 ， 更 新 这 个 指针 集 
合 都 需要 O (log, N) 的 时 间 复 杂 度 。 所 以 一 种 思路 是 我 们 去 寻找 一 种 
新 的 保存 队列 中 元 素 相 对 大 小 关系 的 指针 集合 ， 并 且 使 得 更 新 这 个 指 
针 集合 的 时 间 复 杂 度 更 低 。 

让 我 们 带 着 这 个 目标 ， 考 虑 用 其 他 的 底层 数据 结构 来 实现 “先入 先 
出 ”的 功能 。 由 于 栈 是 一 个 和 队列 极其 相似 的 数据 结构 ， 我 们 不 妨 先 看 
看 栈 。 


对 于 栈 来 讲 ，Push 和 Pop 操 作 都 是 在 栈 顶 完成 的 ， 所 以 很 容易 维护 
栈 中 的 最 大 值 ， 它 的 时 间 复 杂 度 为 O0 (1) 。 其 基本 实现 如 下 : 


代码 清单 3-9 


class stack 
Public: 
stackl) 


~ Yo TT ye = 
STACKLIOD 一 47 


maxStackIitemIincex = 一 工 ; 


StackTop++ 
if(stackTop >= MAXN) 
超出 栈 的 最 大 存储 量 
Else 
{ 
tackIitem[stackTop)] 三 x 
£ (x ax()) 


link2NextMaxItem[stackTop]) 
maxStackItemIincdex = stackTop; 


link2NextMaxItem[stackTop] 


已 经 没有 元 素 了 ， 所 以 不 能 pop 


这 里 ， 维 护 一 个 最 大 值 的 序列 (link2NextMaxItem) 来 保证 Max 操 
作 的 时 间 复 杂 度 为 O (1) ， 相 当 于 用 空间 复杂 度 换取 了 时 间 复 杂 度 。 

如 果 能 够 用 栈 有 效 地 实现 队列 ， 而 栈 的 Max 操 作 又 很 容易 实现 ， 那 
么 队列 的 Max 操 作 也 就 能 有 效 地 完成 了 。 那 如 何 使 用 栈 实现 队列 ， 基 本 
操作 的 时 间 复 杂 度 又 是 多 少 呢 ? 

考虑 使 用 两 个 栈 来 实现 一 个 队列 ， 设 为 栈 A 和 栈 B。 

这 样 队列 的 类 可 以 如 下 定义 : 
代码 清单 3-10 


上 述 代码 能 够 用 栈 来 实现 一 个 队列 。 出 队 的 时 候 ， 如 果 A 扒 栈 为 
空 ， 那 么 “把 B 堆 栈 的 数据 都 弹出 并 压 入 A 堆栈 ”这 个 操作 不 是 O (1) 
的 ， 虽然 如 此 ， 但 从 每 个 元 素 的 角度 来 看 ， 它 被 移动 的 次 数 最 多 可 能 
有 3 次 ， 这 3 次 分 别 是 : 从 B 堆 栈 进 入 ; 当 A 扒 栈 为 空 时 ， 从 B 堆 栈 弹出 
并 压 入 A 堆 栈 ; 从 A 扒 栈 被 弹出 。 相 当 于 入 队 经 过 一 次 操作 ， 出 队 经 过 
两 次 操作 。 所 以 这 种 方法 的 平均 时 间 复 杂 度 是 线性 的 。 


总 结 


通过 这 道 题 ， 我 们 了 解 到 可 以 用 不 同 的 底层 结构 来 实现 队列 这 个 
抽象 的 容器 ， 并 且 可 以 用 空间 换 时 间 的 方法 来 降低 时 间 复 杂 度 。 读 者 
不 妨 再 试 试 其 他 方法 ， 并 比较 不 同方 法 的 优 劣 。 


3.8” 求 二 叉 树 中 节 扣 的 最 大 距离 


如 果 我 们 把 二 叉 树 看 成 一 个 图 ， 父 子 节点 之 间 的 连 线 看 成 是 双向 
的 ， 我 们 姑且 定义 “距离 ”为 两 个 节点 之 间 边 的 个 数 。 

写 一 个 程序 求 一 棵 二 叉 树 中 相距 最 远 的 两 个 节点 之 间 的 距离 。 

如 图 3-11 所 示 ， 粗 箭头 的 边 表示 最 长 距离 : 


G (®) 
图 3-11 ” 树 中 相距 最 远 的 两 个 节点 A，B 
分 析 与 解法 
我 们 先 画 几 个 不 同形 状 的 二 叉 树 ， (如 图 3-12 所 示 ) ， 看 看 能 否 得 


到 一 些 启 才 o 


图 3-12” 几 个 例子 


从 例子 中 可 以 看 出 ， 相 距 最 远 的 两 个 节点 ， 一 定 是 两 个 叶子 节 
点 ， 或 者 是 一 个 叶子 节点 到 它 的 根 节点 。 (为 什么 ? ) 

[解法 一 】 

根据 相距 最 远 的 两 个 节点 一 定 是 叶子 节点 这 个 规律 ， 我 们 可 以 进 
四 步 讨论 。 

对 于 任意 一 个 节点 ， 以 该 节点 为 根 ， 假 设 这 个 根 有 K 个 孩子 节点 ， 
那么 相距 最 远 的 两 个 节点 U 和 V 之 间 的 路 径 与 这 个 根 节点 的 关系 有 两 种 
情况 : 

1. 若 路 径 经 过 根 Root， 则 U 和 V 是 属于 不 同 子 树 的 ， 且 它们 都 是 
该 子 树 中 到 根 节 点 最 远 的 节点 ， 否 则 跟 它 们 的 距离 最 远 相 矛 盾 。 这 种 
情况 如 图 3-13 所 示 : 


2 


图 3-13 ”相距 最 远 的 节点 在 左右 最 长 的 子 树 中 


2. 如 果 路 径 不 经 过 Root， 那 么 它们 一 定 属于 根 的 K 个 子 树 之 一 。 
并 且 它 们 也 是 该 子 树 中 相距 最 远 的 两 个 顶点 。 如 图 3-14 中 的 节点 A: 


OY» 6 
图 3-14 ”相距 最 远 的 节点 在 某 个 子 树 下 


因此 ， 问 题 就 可 以 转化 为 在 子 树 上 的 解 ， 从 而 能 够 利用 动态 规划 
来 解决 。 


设 第 K 棵 子 树 中 相距 最 远 的 两 个 节点 : Ui 和 Vi ， 其 距离 定义 为 d 
(Ul ，Vi ) ， 那 么 节点 Ul 或 Vi 即 为 子 树 K 到 根 节点 RI 距离 最 长 的 节 
点 。 不 失 一 般 性 ， 我 们 设 Ul 为 子 树 K 中 到 根 节点 RI 距离 最 长 的 节点 ， 
其 到 根 节点 的 距离 定义 为 4 (Ul ，R) 。 取 d (U; ，R) (1<i<k) 中 最 
大 的 两 个 值 max1 和 max2， 那 么 经 过 根 节 点 R 的 最 长 路 径 为 max1 十 max2 
十 2， 所 以 树 R 中 相距 最 远 的 两 个 点 的 距离 为 : max{d (U1 ，V1 
) ，...，d (Ul , Vy.) ，maxl 十 max2 十 2}。 

采用 深度 优先 搜索 如 图 3-15， 只 需要 人 遍历 所 有 的 节点 一 次 ， 时 间 复 
杂 度 为 O (IE|) =O (|V| 一 1) ， 其 中 V 为 点 的 集合 ，E 为 边 的 集合 。 
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图 3-15 ”深度 遍历 示意 图 


示例 代码 如 下 ， 我 们 使 用 二 叉 树 来 实现 该 算法 。 
代码 清单 3-11 


// 数据 结构 定义 


struct NODE 


{ 


}3 


NODE* pLeft; /7 左 孩 子 

NODE* pRight; /7 右 孩 子 

int nMaxLeft; // 左 子 树 中 的 最 长 距离 
int nMaxRight; // 右 子 树 中 的 最 长 距离 
char chvalue; /7 该 节点 的 值 


int nMaxLen = 0; 


// 寻找 树 中 最 长 的 两 段 距离 


void FindMaxLen {NODE* pRoot) 


{ 


Z/ 遍历 到 叶子 节点 ， 返 回 
if(pRoot == NULL) 
{ 

return; 


} 


// 如 果 左 子 树 为 空 ， 那 么 该 节点 的 左边 最 长 距离 为 0 
if(pRoot -> pLeft == NULL) 
{ 
PRoot -> nMaxLeft = 0; 
} 


/7 如 果 右 子 树 为 空 ， 那 么 该 节点 的 右边 最 长 距离 为 0 
if{pRoot -> pRight == NULL) 
{ 
PRoot -> nMaxRight = 0; 
} 


// 如 果 左 子 树 不 为 空 ， 递归 寻找 左 子 树 最 长 距离 
if{pRoot -> pLeft != NULL) 
{ 
FindMaxLen (PRoct -> pLeft); 
} 


// 如 果 右 子 树 不 为 空 ， 递 归 寻 找 右 子 树 最 长 距离 
if{pRoot -> PRight != NULEL) 
{ 
FindMaxLen (PRoot -> pRight); 
} 


< 


/1 桂 最 长 节点 距离 
if(pRoot -> pLeft != NULL) 


int nTempMax = 
if(pRoot 一 Left -> nMaxLeft PRoot -> pLeft -> nMaxRight) 
{ 
nTempMax = PRoot -> pLeft -> nMaxLeft 
1 
1] se 
1 


nTempMax = pRoot -> pLeft -> nMaxRight; 


PRoot -> nMaxLeft = nTempMax + 1; 


/计算 右 子 树 最 长 节点 距离 
if(pRoot -> pRight != NULL) 
int nTempMax = 0D; 
if(pRoot -> pRight -> nMaxLeft > pRoot -> pRight -> nMaxRight) 
{ 
nTempMax = pRoot -> pRight -> nMaxLeft; 
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-> pRight -> nMaxRight; 


PRoot -> nMaxRight = nTempMax + 1; 


扩展 问题 

在 代码 中 ， 我 们 使 用 了 递归 的 办 法 来 完成 问题 的 求解 。 那 么 是 否 
有 非 递归 的 算法 来 解决 这 个 问题 呢 ? 
总 结 

对 于 递归 问题 的 分 析 ， 笔 者 有 一 些小 小 的 体会 : 

1. 先 弄 清楚 递归 的 顺序 。 在 递归 的 实现 中 ， 往 往 需 要 假设 后 续 的 
调用 已 经 完成 ， 在 此 基础 之 上 ， 才 实现 递归 的 逻辑 。 在 该 题 中 ， 我 们 


/ 


就 是 假设 已 经 把 后 面 的 长 度 计 算出 来 了 ， 然 后 继续 考虑 后 面 的 逻辑 ，; 
2. 分 析 清 楚 递 归 体 的 人 逻辑， 然后 写 出 来 。 比 如 在 上 面 的 问题 中 ， 
递归 体 的 逻辑 就 是 如 何 计算 两 边 最 长 的 距离 ， 
3. 考虑 清楚 递归 退出 的 边界 条 件 。 也 就 说 ， 哪 些 地 方 应 该 写 
returno 


注意 到 以 上 3 点 ， 在 面 对 递 归 问 题 的 时 候 ， 我 们 将 总 是 有 章 可 循 。 


3.9 ”重建 二 叉 树 


每 一 个 学 过 算法 和 数据 结构 的 同学 都 能 很 流利 地 硼 诵 出 二 叉 树 的 
三 种 遍历 次 序 一 一 前 序 、 中 序 、 后 序 ， 也 都 能 很 快 地 写 出 相应 的 算法 
(希望 如 此 ) ， 那 么 ， 如 果 已 经 知道 了 遍历 的 结果 ， 能 不 能 把 一 棵 二 
叉 树 重新 构造 出 来 呢 ? 

给 定 一 棵 二 叉 树 ， 假 设 每 个 节 损 都 用 唯一 的 字符 来 表示 ， 具 体 结 
构 如 下 : 
和 


NODE* pRight; 
char chValue; // it can be other data type 


假设 已 经 有 了 前 序 遍 历 和 中 序 遍 历 的 结果 ， 和 希望 通过 一 个 算法 重 
建 这 棵 树 。 

给 定 冰 数 的 定义 如 下 : 
void Rebuild(char* ppreOrder, char* pinOrder,int nTreeLen, NODE** pRoot) 
参数 : 

pPreOrder: 以 nul 为 结尾 的 前 序 遍 历 结 果 的 字符 串 数组 。 

pInOrder: 以 nul 为 结尾 的 中 序 遍 历 结果 的 字符 串 数组 。 

nTreeLen: 树 的 长 度 。 

pRoot: 返回 node** 类 型 ， 根 据 前 序 和 中 序 遍 历 结 果 重 新 构建 树 的 
根 节点 。 
例如 : 

前 序 遍历 结果 : abd cef 

中 序 遍 历 结 果 : dbaecf 

重建 的 树 如 图 3-16 所 示 : 


图 3-16 ”重建 树 示 意图 

请 用 C 或 C++ 来 实现 二 叉 树 的 重建 。 
分 析 与 解法 

我 们 先 回忆 一 下 定义 : 

前 序 遍 历 : 先 访问 当前 节点 ， 然 后 以 前 序 访问 左 子 树 ， 右 子 树 。 

中 序 遍 历 : 先 以 中 序 遍 历 左 子 树 ， 接 着 访问 当前 节点 ， 然 后 以 中 
序 遍 历 右 子 树 。 

根据 前 序 遍 历 和 中 序 人 遍历 的 特点 ， 可 以 发 现 如 下 规律 : 

前 序 遍 历 的 每 一 个 节点 ， 都 是 当前 子 树 的 根 节点 。 同 时 ， 以 对 应 
的 节点 为 边界 ， 就 会 把 中 序 遍 历 的 结果 分 为 左 子 树 和 右 子 树 。 

前 序 : 

abdcef 

“a ”是 根 节点 

中 序 : 

dbaect 

“a "是 根 节 点 ， 把 字符 串 分 成 左右 两 个 子 树 

“a” 是 前 序 人 遍历 节点 中 的 第 一 个 元 素 ， 可 以 看 出 ， 它 把 中 序 遍 历 的 
结果 分 成 “<db” 和 “ecf” 两 个 部 分 。 可 以 从 图 3-16 中 看 出 ， 这 就 是 “a” 的 左 
子 树 和 右 子 树 的 遍历 结果 。 


如 果 能 够 找到 前 序 遍 历 中 对 应 的 左 子 树 和 右 子 树 ， 就 可 以 把 “a”* 作 
为 当前 的 根 节点 ， 然 后 依次 递归 下 去 ， 这 样 就 能 够 把 左 子 树 和 右 子 树 
的 遍历 结果 给 依次 恢复 出 来 。 

确定 前 序 遍 历 左 右 子 树 的 这 个 问题 ， 读 者 可 以 在 看 解法 之 前 自行 
思考 一 下 。 
[解法 一 】 

根据 前 面 的 分 析 ， 可 以 通过 如 下 的 代码 递归 解决 这 个 问题 。 
代码 清单 3-12 


// ReBuild.cpp : 根据 前 序 及 中 序 结果 ， 重 建树 的 根 节点 
/i 


// 定义 树 的 长 度 。 为 了 后 序 调用 实现 的 简单 ， 我 们 直接 用 宏 定义 了 树 节点 的 总 数 
#define TREELEN 6 


1/ 树 节点 
struct NODE 
{ 
NODE* pLeft; // 左 节 点 
NODE* pRight; /7 右 节 点 
char chvalue; /7 节点 值 
}; 
void ReBuild(char* pPreOrder, /1 前 序 遍 历 结 果 
char* pInorder, /7/ 中 序 遍 历 结果 
int nTreeLen, // 树 长 度 
NODE** pRoot) /7Z 根 节点 
{ 
/7 检查 边界 条 件 
if{(pPreOrder == NULL || pInOorder == NULL) 
{ 
return; 
} 


/7 获得 前 序 遍 历 的 第 一 个 节点 

NODE* pTemp = new NODE; 

pTemp -> chValue = *pPreOrder; 
pTemp -> pLeft = NULL; 

pTemp -> pRight = NULL; 


1/ 如 果 节 点 为 空 ， 把 当前 节点 复制 到 根 节点 
if{(*pRoot == NULL) 
{ 
*pRoot = pTemp; 
} 


// 如 果 当 前 树 长 度 为 1， 那 么 已 经 是 最 后 一 个 节点 
if(nTreeLen == 1) 
{ 


return; 


} 


// 寻找 子 树 长 度 

char* pOrgInOrder = pInOrder; 
char* pLeftEnd = pInOrder; 
int nTempLen = 0; 


/7/ 找到 左 子 树 的 结尾 


while(*pPreOrder != *pLeftEnd) 
{ 
if(pPreOrder == NULL || pLeftEnd == NULL) 
{ 
return; 
} 
nTempLent++; 


// 记录 临时 长 度 ， 以 免 洲 出 
if{nTempLen > nTreeLen) 


{ 


break; 


pLeftEnd++; 
} 


// 寻找 左 子 树 长 度 
int nLeftLen = 0; 
nLeftLen = (int) (pLeftEnd - pOrgInOrder); 


// 寻找 右 子 树 长 度 


int nRightLen = 0; 
nRightLen = nTreeLen 一 nLeftLen 一 1;} 


// 重建 左 子 树 
if(nLeftLen > 0) 
{ 
ReBuild{pPreOrder + 1, pInOrder, nLeftLen, &((*pRoot) -> pLeft)); 
} 


// 重建 右 子 树 

if(nRightLen > D0) 

{ 
ReBuild{pPreOrder + nLeftLen + 1, pInOrder + nLeftLen + 1, 
nRightLen, &((*pRoot) -> pRight)); 


} 


/7 示例 的 调用 代码 

int main(int argc, char* argv[]) 

{ 
char szPreOrder [TREELEN]={'a', 'b’', 'd', 'c', 'e', 'f"]}; 
char BZLnoOrderlTaneeELENl = “Bp "as PPE, "E's "FETs 


NODE* pRoot = NULL; 
ReBuildlszPreOrder, szInOrder, TREELEN, &pRoot); 


递归 的 问题 可 以 通过 栈 或 队列 的 方式 来 实现 。 栈 或 队列 的 实现 相 
对 简单 ， 留 给 读者 自行 解决 。 
扩展 问题 


1.， 如 果 根据 字母 不 能 确定 节点 ， 换 句 话 说 ， 节 点 上 面 的 字母 有 可 
能 是 相同 的 。 那 么 ， 这 道 题 该 如 何 来 做 呢 ? 重 构 出 来 的 二 叉 树 是 唯一 
的 吗 ? 如 果 不 是 唯一 的 ， 如 何 重 构 出 所 有 可 能 的 解 呢 ? 

2. 如 何 判 断 给 定 的 前 序 遍 历 和 中 序 马 历 的 结果 是 合理 的 呢 ? 

3. 如 果 知 道 前 序 和 后 序 人 遍历 的 结果 ， 能 重 构 二 又 树 么 ? 


总 结 


这 个 题目 可 能 出 现在 一 些 参考 书 中 ， 有 读者 看 到 这 道 题目 之 后 可 
能 会 大 失 所 望 地 说 :“ 微 软 也 用 书 上 的 题目 来 面试 人 啊 ! ” 

的 确 ， 不 仅 如 此 ， 面 试 者 还 经 单 考察 排序 算法 的 实现 。 有 不 少 应 
聘 者 不 仅 不 能 完整 地 解答 问题 ， 甚 至 不 能 描述 完整 的 思路 。 这 样 的 表 
现 的 确 对 不 起 在 简历 上 写 的 “精通 算法 ”等 字样 。 

如 果 读 者 自行 解答 这 道 题 目 ， 一 般 不 会 少 于 20 分 钟 。 并 且 ， 在 编 
译 或 调试 时 ， 往 往 还 会 出 现 bug。 

这 些 bug 通 常 是 怎样 产生 的 呢 ? 

1. 边界 条 件 的 检查 。 千 万 不 要 认为 边界 检查 不 重要 ， 事 实 上 相当 
重要 。 

2. 没有 用 实际 的 例子 进行 测试 。 比 如 说 ， 试 验 非 完全 二 叉 树 ， 退 
化 的 二 叉 树 ， 等 等 。 


3.10 “分 层 遍 历 二 叉 树 


1. 给 定 一 棵 二 叉 树 ， 要 求 按 分 层 遍 历 该 二 叉 树 ， 即 从 上 到 下 按 层 
次 访问 该 二 叉 树 〈 每 一 层 将 单独 输出 一 行 ) ， 每 一 层 要 求 访问 的 顺序 
为 从 左 到 右 ， 并 将 节点 依次 编号 。 那 么 分 层 遍 历 如 图 3-17 中 的 二 叉 树 ， 
正确 输出 应 为 : 
l 
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图 3-17 


2. 写 另 外 一 个 图 数 ， 打 印 二 叉 树 中 的 某 层 次 的 节点 (从 左 到 
右 ) ， 其 中 根 节点 为 第 0 层 ， 哨 数 原 型 为 int PrintNodeAtLevel 
(Node*root，int level) ， 成 功 返 回 1， 失 败 则 返回 0。 


分 析 与 解法 
天 于 二 叉 树 的 问题 ， 由 于 其 本 身 固有 的 递归 特性 ， 通 单 我 们 可 以 
用 递归 算法 来 解决 。 至 于 题 中 的 两 个 问题 ， 仔 细 考 虑 可 以 发 现 ， 如 果 


解决 了 第 二 个 问题 ， 则 问题 1 可 采用 问题 2 的 解法 来 依次 遍历 其 各 层 节 
点 。 那 么 我 们 先 来 考虑 问题 2 的 解法 。 

首先 我 们 定义 节点 的 数据 结构 为 〈 设 二 叉 树 中 的 数据 类 型 为 整 
数 ) : 


struct Node 


{ 
int data; // 节 点 中 的 数据 
Node* 1Chilai /7/ 左 子 指针 
Node* rcChild; /7 右 子 指针 


假设 要 求 访 问 二 叉 树 中 第 k 层 的 节点 ， 那 么 其 实 可 以 把 它 转换 成 分 
别 访问 “以 该 二 叉 树 根 节点 的 左右 子 节点 为 根 节点 的 两 棵 子 树 ” 中 层次 
为 k 一 1 的 节点 ， 如 题目 中 的 二 叉 树 ， 给 定 k 二 2， 即 要 求 访 问 原 二 又 树 
中 第 2 层 的 节点 ( 根 节 点 为 第 0 层 ) ， 可 把 它 转 换 成 分 别 访问 以 节点 2、 
3 为 根 节点 的 两 棵 子 树 中 第 k 一 1 二 1 层 的 节点 。 
代码 清单 3-13 

/ 输出 以 root 为 根 节点 中 的 第 level 层 中 的 所 有 节点 《从 左 到 右 ，， 成 功 返 回 1， 
/ 失 歼 则 返回 0 
og 光 又 树 的 根 节点 


evel1 为 层次 数 ， 其 中 根 节点 为 第 0 层 
vel (Node* root 


PrintNodeAt Lev 


采用 递归 算法 ， 思 路 比较 清晰 ， 写 出 来 的 代码 也 很 简洁 ， 但 缺点 
就 是 递归 阅 数 的 调用 效率 较 低 ， 无 论 是 耗费 的 计算 时 间 还 是 占用 的 存 
储 空间 都 比 非 递 归 算 法 要 多 。 


以 上 解决 了 递归 访问 二 叉 树 中 给 定 层次 节点 的 问题 ， 那 么 如 何 利 
用 该 算法 来 解决 问题 1 呢 ?” 如 果 我 们 知道 该 二 叉 树 的 深度 n， 那 么 只 需 
要 调用 n 次 PrintNodeAtLevel(): 
代码 清单 3-14 


/ 层次 饥 历 二 叉 树 
:paran 
又 树 的 根 和 节点 


depth， 树 的 深度 


如 果 事 先 不 知道 二 叉 树 的 深度 ， 那 么 还 需要 写 一 个 求 二 叉 树 的 深 
度 的 算法 ， 该 算法 也 可 用 递归 实现 ， 有 兴趣 的 读者 可 以 自己 试 试 。 但 
求 二 叉 树 深度 与 问题 二 是 同等 时 间 复 杂 度 的 问题 ， 能 不 能 不 求 二 叉 树 
的 深度 呢 ? 当 访 问 二 叉 树 某 一 层次 失败 的 时 候 返 回 就 可 以 了 ， 代 码 如 
下 : 
代码 清单 3-15 


/ 层次 遍历 二 又 树 


IOoOr(inNnt lieveili=U; 上 iEeVel 


至 此 我 们 解决 了 题目 中 的 两 个 问题 ， 但 细心 的 读者 可 能 会 发 现 ， 
其 实在 问题 1 的 算法 中 ， 对 二 又 树 中 每 一 层 的 访问 都 需要 重新 从 根 节点 
开始 ， 直 到 访问 完 所 有 的 层次 。 这 样 的 做 法 ， 效 率 实在 不 高 ， 那 么 有 
没有 更 好 的 算法 呢 ? 


在 访问 第 k 层 的 时 候 ， 我 们 只 需要 知道 第 k 一 1 层 的 节点 信息 就 足够 
了 ， 所 以 在 访问 第 k 层 的 时 候 ， 要 是 能 够 知道 第 k 一 1 层 的 节点 信息 ， 就 
不 再 需要 从 根 节点 开始 遍历 了 。 

根据 上 述 分 析 ， 可 以 从 根 节 点 出 发 ， 依 次 将 每 层 的 节点 从 左 到 右 
压 入 一 个 数组 ， 并 用 一 个 游标 Cur 记 录 当 前 访问 的 节点 ， 另 一 个 游标 
Last 指 示 当 前 层次 的 最 后 一 个 节点 的 下 一 个 位 置 ， 以 Cur==Last 作 为 当 
前 层次 访问 结束 的 条 件 ， 在 访问 某 一 层 的 同时 将 该 层 的 所 有 节点 的 子 
节点 压 入 数组 ， 在 访问 完 某 一 层 之 后 ， 检 查 是 否 还 有 新 的 层次 可 以 访 
问 ， 直 到 访问 完 所 有 的 层次 (不 再 有 新 节点 可 以 访问 ) 。 

首先 将 根 节点 1 压 入 数组 ， 并 将 游标 Cur 置 为 0 (游标 如 图 3-18 中 的 
箭头 所 示 ， 数 组 下 标 从 0 开始 ) ， 游 标 Last 置 为 1: 

Cur Last 


图 3-18 


Cur<Last， 说 明 此 层 (第 一 层 ) 尚未 被 访问 ， 因 此 ， 依 次 访问 Cur 
到 Last 之 间 的 所 有 节点 (第 一 层 只 有 一 个 节点 ) ， 并 依次 将 被 访问 节点 


的 左右 子 节点 压 入 数组 (注意 左右 子 节点 压 入 数组 的 顺序 ) ， 那 么 访 
问 完 第 一 层 的 游标 及 数组 的 状态 如 图 3-19 所 示 : 
Cur Last 
_ 和 
1 2 3 
图 3-19 


由 于 Cur==Last， 说 明 该 层 (第 一 层 ) 已 被 访问 完 ， 此 时 数组 中 还 
有 未 被 访问 到 的 节点 ， 则 输出 换行 符 (为 输出 新 的 一 行 做 准备 )， 并 


将 Last 定 位 于 新 一 行 的 末尾 ( 即 数组 当前 最 后 一 个 元 素 的 下 一 位 ) ， 如 
图 3-20 所 示 : 


图 3-20 


继续 依次 住 下 访问 其 他 层次 的 节点 ， 直 到 访问 完 所 有 的 层次 (不 
再 有 新 节点 可 以 访问 ) ， 如 图 3-21 所 示 。 
CurLast 


代码 如 下 : 
代码 清单 3-16 


// 按 屋 次 遍历 二 又 树 
// param 
// root， 二 叉 树 的 根 节 点 


void PrintNodeByLevel (Node* root) 


{ 
if(root mm NULL) 
return; 
vector<Node*> vec; /1 这 里 我 们 使 用 STL 中 的 vector 来 代替 数组 ， 可 利用 
// 到 其 动态 扩展 的 属性 
vec.push back (root); 
int cur = 0; 
nt last = 1 
whilet{cur < vec.sizel()) 
{ 
Last = vec.size!(); /7 新 的 一 行 访问 开始 ， 重 新 定位 1ast 于 当前 行 最 后 
// 一 个 节点 的 下 一 个 位 置 
while(cur < last) 
{ 
cout << vec[cur] -> data << " "; // 访 问 节点 
if(!vec[cur] -> 1Child) /7 当前 访问 节点 的 左 节点 不 为 空 则 压 入 
vec.push_back (vec[cur] -> lchiid); 
if(!vec[cur] -> rChild) /当前 访问 节点 的 右 节 点 不 为 空 则 压 入 ， 
/ /注意 左右 节点 的 访问 顺序 不 能 店 倒 
vec.push_back (vec[cur] -> rchild); 
CUrt++; 
} 
cout << endl; // 当 cur == last, 说明 该 层 访 问 结 束 ， 输 出 换行 符 
} 
} 


扩展 问题 


如 果 要 求 按 深 度 从 下 到 上 访问 图 3-22 中 的 二 叉 树 ， 每 层 的 访问 顺序 
仍然 是 从 左 到 右 ， 即 访问 顺序 变 为 : 


28 
456 
2 
下 


需要 如 何 对 算法 进行 改进 ? 


| > | 3 | 
外 = | 
4 (5) 6 
» | 
1) 
图 3-22 


提示 : 可 考虑 左右 节点 的 访问 顺序 。 
如 果 按 深度 从 下 到 上 访问 ， 每 层 的 访问 顺序 变 成 从 右 到 左 ， 即 访 


问 顺 序 变 为 : 
87 
654 
32 
1 


又 需要 如 何 对 算法 进行 改进 ? 


3.11 ”程序 改 错 


一 次 面试 之 后 ， 应 聘 者 和 面试 者 微笑 着 握手 告别 ， 但 是 他 们 对 面 
试 的 评价 往往 相差 很 远 ， 例 如 : 

应 聘 者 : 来 了 一 个 比较 和 气 的 员工 ， 我 们 谈 了 谈 各 种 排序 的 优 
劣 ， 我 昨天 晚上 在 网 上 看 的 东西 都 用 上 了 ， 我 几乎 要 把 他 侃 时 了 。 后 
来 ， 他 要 我 写 一 个 二 分 查找 的 程序 ， 我 略 加 思索 ， 很 快 地 写 好 了 ， 写 
得 太 快 了 ， 有 一 个 条 件 没 有 考虑 ， 让 他 看 了 出 来 。 后 来 他 叫 我 再 检查 
一 下 还 有 什么 错 ， 我 还 是 比较 自信 的 ， 觉 得 代码 没什么 大 问题 。 他 挑 
出 来 一 些小 小 的 问题 ， 无 外 乎 一 些 “ 牛 角 尖 ”的 问题 ， 我 也 很 快 搞定 
eo 觉得 面试 也 不 过 如 此 。 

面试 者 : 我 们 先 谈 了 谈 了 谈 各 种 排序 的 优 劣 ， 我 发 现 他 混淆 了 各 
种 排序 方法 的 优 缺 点 和 适用 范围 ， 叙 述 得 完全 没有 条 理 ( 例 
如 .……) 。 我 叫 他 写 一 个 完整 的 二 分 排序 。 他 想 了 很 长 时 间 ， 最 后 写 
出 来 的 解法 有 一 个 严重 的 错误 ， 我 指出 之 后 ， 他 能 想 出 一 个 改正 的 方 
法 ， 但 不 是 最 优 的。 我 强调 “完整 的 程序 ”， 让 他 再 检查 一 下 还 有 什么 
错 ， 他 根本 不 会 用 一 些 测试 用 例 去 检查 ， 而 是 把 程序 又 自己 读 了 一 
遍 ， 说 没有 错误 。 我 指出 了 人 至少 4 个 小 错误 ， 他 能 认识 这 些 错误 ， 但 是 
在 修改 中 把 原来 算法 的 结构 破坏 了 ， 最 后 的 解法 显得 非常 混乱 。 他 在 
这 个 题目 中 花 了 很 长 时 间 .….… 觉得 他 明显 达 不 到 我 们 的 要 求 。 

二 分 查找 是 算法 设计 的 基本 功 。 它 的 思想 很 简单 : 分 而 治之 ; 即 
通过 把 一 个 大 问题 分 解 成 多 个 子 问题 来 降低 解 题 的 复杂 度 。 思 路 固然 
简单 ， 但 是 许多 人 在 写 代 码 实现 的 时 候 却 往往 容易 出 现 各 种 错误 。 下 
面 是 一 个 程序 片段 ， 其 中 包含 了 一 些 常见 的 错误 ， 这 些 错 误 正 是 我 们 
在 写 二 分 查找 程序 时 所 应 该 注意 的 地 方 。 你 能 够 找 出 来 吗 ? 

问题 : 找 出 一 个 有 序 (字典 序 ， 字符 串 数 组 arr 中 值 等 于 字符 串 v 的 
元 素 的 序号 ， 如 果 有 多 个 元 素 满足 这 个 条 件 ， 则 返回 其 中 序号 最 大 
的 。 
代码 清单 3-17 带 有 错误 的 二 分 查找 源码 


分 析 与 解法 


在 写 循 环 《或 者 递归 ) 程序 的 时 候 ， 我 们 特别 应 该 注意 三 个 方面 
的 问题 : 初始 条 件 ， 转 化 ， 终 止 条 件 。 针 对 上 面 这 个 二 分 程序 ， 我 们 
也 要 逐一 考虑 这 些 方面 。 

程序 的 第 一 个 问题 就 是 : midIndex= (minIndex 十 maxIndex) /2 ; 

这 样 的 写法 粗 看 没什么 不 妥 ， 但 在 一 些 极端 情 况 下 ， 会 由 于 求 和 
中 间 结 果 的 溢出 而 导致 出 现 错误 〈 假 设 这 是 个 32 位 程序 ，32 位 有 符号 
整数 可 以 表示 的 范围 是 -2147483648 一 +2147483647， 如 果 minIndex 加 上 
maxIndex 的 值 恰好 超过 了 +2147483647， 那 么 就 会 造成 上 溢出 ， 导 致 
midIndex 变 成 负数 ) 。 所 以 我 们 最 好 把 它 写 成 midIndex 王 minIndex 十 
(maxIndex 一 minIndex) /2 ; 
第 二 个 问题 是 : 循环 的 终止 条 件 有 可 能 无 法 到 达 ， 也 就 是 说 在 某 
些 测 试用 例 下 ， 程 序 不 会 停止 。 比 如 ， 当 minIndex 一 2，maxIndex 一 3， 
而 arr[IminIndex]< 三 v 的 时 候 ， 程 序 将 进入 死 循 环 。 

所 以 改正 后 的 代码 是 : 


代码 清单 3-18 ”纠正 错误 后 的 二 分 查找 源码 


int minIndex = b, maxIndex = 8&8, midIndex; 


/7 循环 结束 有 两 种 情况 : 
// 若 minIndex 为 偶数 则 minInadex == maxIndex:; 


/7 吾 则 就 是 minInadex == maxIndex - 1 


while(minIndex < maxIndex - 1) 

{ 
midIndex = minI Index + (maxIndex 一 minIndex) / 2; 
if(strcmpl(larr[midIindex] , Vv) <= 0 ) 


{ 
minIindex = midIndex; 


lSse 


{ 
/不 病 要 miaIindqex 一 1， 防 小 minIndex == maxIndex 


maxIndex = midIndex; 


if{(!strcmp (arr [maxIndex] , v)) /7 先 判 断 序号 最 大 的 值 
{ 
return maxIndex; 


else if (!strcmplarr[minIndex] , wv) ) 


return minIndex 7 


retieris = 


你 也 许 会 抱怨 :“ 哇 ， 面 试 这 样 的 问题 也 太 吹 毛 求 普 了 吧 ? ”， 是 
的 ， 世 界 上 怕 就 怕 “ 认 真 ” 二 字 ， 任 何 简单 的 问题 认真 起 来 就 不 再 简 
单 。 很 多 让 微软 和 其 他 公司 遭受 巨大 损失 的 安全 漏洞 ， 就 是 因为 一 些 
看 似 不 错 ， 其 实 有 漏洞 的 边界 条 件 的 检查 。 

要 避免 出 现 类 似 的 问题 ， 需 要 我 们 在 写 程序 的 时 候 特别 留意 这 些 
容易 出 错 的 地 方 。 下 面 列 出 一 些 与 二 分 查找 相关 的 常见 问题 ， 题 目 虽 
然 都 很 简单 ， 但 是 大 家 不 妨 斌 试看， 为 每 道 题写 出 一 个 正确 的 解答 : 


给 定 一 个 有 序 (不 降序 ) 数组 arr， 求 任意 一 个 i 使 得 arr[i] 等 于 v， 
不 存在 则 返回 -1 

给 定 一 个 有 序 (不 降序 ) 数组 arr， 求 最 小 的 使 得 arr[i] 等 于 v， 
存在 则 返回 -1 

给 定 一 个 有 序 (不 降序 ) 数组 arr， 求 最 大 的 i 使 得 arr[i] 等 于 v， 
存在 则 返回 -1 

给 定 一 个 有 序 (不 降序 ) 数组 arr， 求 最 大 的 i 使 得 arr[i] 小 于 v， 不 
存在 则 返回 -1 

给 定 一 个 有 序 (不 降序 ) 数组 arr， 求 最 小 的 i 使 得 arr[i] 大 于 v， 不 
存在 则 返回 -1 

在 写 完 解答 之 后 ， 请 大 家 不 要 停止 思考 ， 能 不 能 接着 为 每 道 题 各 
写 出 关键 的 测试 用 例 呢 ? 
扩展 问题 


下 面 一 个 题目 是 出 现在 笔试 题目 中 的 考题 ， 有 人 写 了 一 个 简单 的 
程序 ， 判断 一 个 单 链 表 是 否 有 环 ， 如 果 有 ， 把 指向 环 开始 的 指针 返 
回 ; 如果 没有 环 ， 返 回 NULL。 

这 个 程序 有 不 少 错误 ， 我 们 能 否 在 尽量 保持 原 程 序 框架 的 基础 
上 ， 修 改 这 个 程序 ， 以 得 到 正确 的 结果 ? 
代码 清单 3-19 ”简单 并 带 有 错误 的 环形 单 链表 检测 代码 


* IsCyclicLinkedList (LinkedList* pHead) 


注释 


GD) strstr 国 数 说 明 : 

原型 : extern char*strstr (char*haystack, char*needle) ; 

用 法 : #include<string.h> 

功能 : 从 字符 串 haystack 中 寻找 needle 第 一 次 出 现 的 位 置 (不 比较 结束 符 NULL) 。 
说 明 : 返回 指向 第 一 次 出 现 needle 位 置 的 指针 ， 如 果 没 找到 则 返回 NULL。 


第 4 章 


数学 之 趣 
一 一 数学 游戏 的 乐趣 


研究 院 的 天 井 里 有 热带 鱼 ， 假 山 ， 午 休 的 躺椅 ， 也 有 人 在 讨论 瓷砖 
覆盖 地 板 的 问题 。 


这 一 章 列举 了 一 些 不 需要 写 具体 程序 的 数学 问题 ， 其 中 的 原理 和 解 
决 问题 的 思路 对 于 提高 思维 能 力 还 是 很 重要 的 。 面 试 的 时 候 ， 我 们 也 会 
考察 应 聘 者 的 数学 分 析 能 力 。 

在 理论 上 ， 我 们 要 严格 地 证 明 一 些 定 理 和 结论 。 在 实际 工作 中 ， 则 
不 必 拘 泥 于 此 ， 例 如 ， 在 “ 数 独 知 多 少 ” 这 一 个 题目 中 ， 纯 数学 的 证 明和 
推理 可 能 需要 相当 多 的 时 间 。 如 果 我 们 只 需要 求 出 大 致 的 上 界 和 下 界 就 
能 解决 实际 问题 ， 那 也 未 尝 不 可 。 面 试 者 在 问 这 些 看 似 很 “ 难 ” 的 题目 
时 ， 事 实 上 是 期 望 应 聘 者 能 够 反问 “这 个 问题 一 定 是 要 精确 的 答案 么 ”我 
能 不 能 求 出 近似 的 解 ， 然 后 再 优化 ? ”能 这 样 反 问 ， 并 且 能 够 运用 各 种 
Heuristic (试探 ， 探 索 的 ) 方法 快速 求 出 解答 的 同学 ， 我 们 非常 欢迎 。 

本 书 的 各 位 作者 对 数学 的 各 个 分 支 都 不 很 熟悉 ， 在 这 里 班 门 弄 佐 ， 
还 希望 能 得 到 读者 的 指点 。 

我 们 把 不 好 归 类 的 几 个 题目 也 放 到 了 本 章 ， 面 试 的 类 型 是 多 种 多 
样 ， 运 用 之 妙 ， 存 平一 心 。 

一 些 人 很 担心 这 本 书 会 把 < 题库 ?泄露 出 去 ,“ 那 以 后 的 面试 就 没有 题 
目 了 ? ”笔者 请 大 家 放心 。 微 软 的 员工 如 果 是 因为 应 聘 者 多 知道 了 几 道 题 
目 ， 就 觉得 无 法 面试 ， 那 这 个 员工 本 人 还 得 多 磨炼 磨炼 一 一 也 许 得 再 作 
为 应 聘 者 经 历 几 次 面试 吧 2。 

也 有 人 会 担心 :“ 肯 定 会 有 人 把 答案 都 背 下 来 ， 到 时 候 所 有 人 都 对 答 
如 流 ， 那 怎么 办 ? ” 

如 果真 的 有 很 多 人 能 够 把 这 几 十 道 题目 及 答案 、 几 十 道 扩展 问题 ， 
以 及 它们 后 面 的 数学 、 计 算 机 原理 、 计 算 机 语言 及 应 用 都 背 得 滚 凡 烂 
熟 ， 这 首先 是 中 国 IT 行 业 的 好 事 。 其 次 ， 这 些 人 都 应 该 来 我 们 公司 
不 用 参加 笔试 了 ， 直 接 和 我 们 联系 吧 ! 


4.1 金刚 坐 飞机 问题 


国外 有 一 个 谚语 : 

问 : 体重 800 磅 的 大 猩猩 在 什么 地 方 坐 ? 

答 : 它 爱 在 哪儿 坐 就 在 哪儿 坐 。 

这 人 句 谚语 一 般 用 来 形容 一 些 “ 强 人 ”并 不 遵守 大 家 公认 的 规则 ， 所 以 
要 对 其 行为 保持 警惕 。 

现在 有 一 班 飞机 将 要 起 飞 ， 乘 客 们 正 准 备 按 机 票 号 码 (1，2，3，... 
N) 依次 排队 登 机 。 突 然 来 了 一 只 大 猩猩 (对 ， 他 叫 金 刚 ) 。 他 也 有 惟 
机 票 ， 但 是 他 插队 第 一 个 登 上 了 飞机 ， 然 后 随意 地 选 了 一 个 座位 坐 下 了 ? 
。 根 据 社会 的 和 谐 程度 ， 其 他 的 乘客 有 两 种 反应 : 

1. 乘客 们 都 义愤 填 唐 , “既然 金刚 同志 不 遵守 规定 ， 为 什么 我 要 遵 
守 ? ”他 们 也 随意 地 找 位 置 坐 下 ， 并 且 坚 决 不 让 座 给 其 他 乘客 。 

2. 乘客 们 虽然 感到 愤怒 ， 但 还 是 以 “和 谐 * 为 重 ， 如 果 自 己 的 位 置 没 
有 被 占领 ， 就 赶紧 坐 下 ， 如 果 自己 的 位 置 已 经 被 别人 (或 者 金刚 同志 
占 了 ， 就 随机 地 选择 另 一 个 位 置 坐 下 ， 并 开始 闭 目 养神 ， 不 再 挪动 位 
置 。 

那么 ， 在 这 两 种 情况 下 ， 第 i 个 乘客 (除去 金刚 同志 之 外 ) 坐 到 自己 
原 机 票 位 置 的 概率 分 别 是 多 少 ? 
分 析 与 解法 

这 两 个 问题 之 间 有 一 处 小 小 的 区 别 ， 这 个 区 别 是 如 何 影响 最 后 的 概 
率 的 呢 ? 
【问题 1 的 解法 】 

我 们 可 以 用 F (i) 来 表示 第 i 个 乘客 坐 到 自己 原 机 票 位 置 的 概率 。 

第 i 个 乘客 坐 到 自己 位 置 (概率 为 F (i) ) ， 则 前 i 一 1 个 乘客 都 不 坐 
在 第 i 个 位 置 ( 设 概率 为 P (i 一 1) ) ， 并 且 在 这 种 情况 下 第 i 个 乘客 随即 
选择 位 置 的 时 候选 择 了 自己 的 位 置 〈 设 概率 为 G (i) ) 。 


而 P (i 一 1) 可 以 分 解 为 前 i 一 2 个 乘客 都 不 坐 在 第 i 个 位 置 的 概率 P (i 
一 2) ， 和 在 前 i 一 2 个 乘客 都 不 坐 在 第 i 个 位 置 的 条 件 下 第 i 一 1 个 乘客 也 不 
坐 在 第 i 个 位 置 上 的 概率 Q (i 一 1) 。 

于 是 得 到 如 下 的 公式 (合并 结果 ) : 

F (i) =G (i) *P (i 一 1) =G (i) *Q (i—1) *P (i 一 2) =G (0) 
*Q (i—1) ...Q (2) *P (1) 

容易 知道 Q (i) = (N-i) / (N 一 i 十 1) ，P (1) = (N-1) /N, G 

(i) =1/ (N—it+1) 
代入 公式 得 到 , F (i) 三 IN。 
【问题 2 的 解法 】 

可 以 按照 金刚 坐 的 位 置 来 分 解 问题 ， 把 原 问题 从 “第 i 个 乘客 坐 在 自 
己 位 置 上 的 概率 是 多 少 ” 变 为 “如 果 金 刚 坐 在 第 n 个 位 置 上 ， 那 么 第 个 乘客 
坐 在 自己 位 置 上 的 概率 是 多 少 ”( 设 这 个 概率 为 f nm) ) 。 

现在 金刚 坐 在 了 n 号 位 置 上 。 如 果 n 二 1 或 n>i， 那 么 第 i 个 乘客 坐 在 自 
己 位 置 上 的 概率 是 1 (因为 大 家 会 尽量 坐 到 自己 的 位 子 上 ，2 号 乘客 将 选 
择 坐 到 2 号 位 置 上 ......) 。 如 果 n=i， 那 么 第 i 个 乘客 是 没 希望 坐 到 自己 的 
位 置 上 了 (他 还 不 至 于 敢 和 金刚 PK) 。 如 果 1<n<i， 那 么 问题 似乎 并 没 
有 太 直 接 的 求解 方式 。 我 们 来 继续 分 解 问题 。 当 金刚 坐 在 了 第 n (1<n< 
i) 个 位 置 上 的 时 候 ， 第 2，3，...，n 一 1 号 的 乘客 都 可 以 坐 到 自己 的 座位 
上 ， 于 是 我 们 可 以 按照 第 n 个 乘客 坐 的 位 置 来 继续 分 解 这 个 问题 。 如 果 第 
n 个 乘客 ， 选 了 金刚 的 座位 ， 那 么 第 i 个 乘客 一 定 坐 在 自己 的 位 置 上 ; 而 
如 果 第 n 个 乘客 坐 在 第 j (n<j 和 =N) 个 座位 上 上， 就 相当 于 金刚 坐 了 第 j 个 
座位 。 

把 问题 分 解 到 这 一 步 ， 应 该 可 以 进行 问题 解答 的 合并 了 。 一 般 来 
讲 ， 合 并 这 个 步 又， 有 可 能 很 简单 ， 也 可 能 很 复杂 ， 这 主要 取决 于 问题 
分 解 的 结果 。 在 这 道 题目 里 ， 合 并 问题 的 主要 工具 是 全 概率 公式 ， 也 即 
PCM) = > PCD) * PMID,, 这 里 表示 各 种 不 同 的 情况 ，P (i) 表示 这 种 


情况 发 生 的 概率 ，PCM|i) 表示 在 这 种 情况 下 事件 M 发 生 的 概率 。 
首先 求解 f (n) (1<n<i) ， 由 前 面 的 分 析 可 知 : 


| 
一 一 一 一 一 一 一 ] FE 一 A | 
三) me a Lt n+2,",N) 
j 


其 中 j 表 示 第 n 个 乘客 坐 的 位 置 。 
所 以 


fn)=1/(N-—n+l)*(+ Fn+D++FVN))<7<D) 〔( 式 1) 
由 此 递 推 式 ， 可 得 f (n) =f (n+1) (1<n<i 一 1) 
将 n 二 2 代入 ( 式 1) ， 再 利用 f (x) 三 1 (x>i) ，f (x) 二 0(x= 


i) ， 另 1<n, n 十 1<i 一 1 可 得 : f(n)= 和 ， 所 以 
1 (m= 1 > | 
N-i+l 
(n) = ] 
NT Elst 7 
(n=i) 
WY 工 ， 一 革 力 就 是 第 ;个 乘客 举 在 自己 位 置 上 记 
D3 Fo) = 二 就 是 第 个 乘客 坐 在 自己 位 置 上 的 要 
率 。 
回顾 


有 些 问题 看 起 来 规模 太 大 而 无 从 下 手 。 这 时 我 们 可 以 采用 分 而 治之 
的 方法 ， 这 个 方法 有 两 个 核心 步 又 : 
1. 分 解 问题 ， 得 到 局 部 问题 的 答案 。 
.合并 问题 的 解答 。 
i 
在 这 个 | 问题 假设 所 有 乘客 是 按照 机 票 座位 的 次 序 (ls 2， 3， 登 
机 的 ， 在 现实 生活 中 ， 乘 客 登 机 并 没有 一 定 的 次 序 。 如 果 在 金刚 抢先 入 


座 之 后 ， 所 有 乘客 以 随机 次 序 登 机 ， 并 且 有 原来 题目 所 描述 的 两 种 行 
为 ， 那 第 i 个 乘客 坐 到 自己 原 机 票 位 置 的 概率 分 别 是 多 少 ? 


4.2 ”次 砖 覆盖 地 板 


某 年 夏天 ， 位 于 希 格 玛 大 厦 四 层 的 微软 亚洲 研究 院 对 办 公 楼 的 天 井 
进行 了 一 次 大 规模 的 装修 。 原 来 的 地 板 铺 有 NxM 块 正方 形 瓷 砖 ， 这 些 资 
传 都 已 经 破损 老化 了 ， 需 要 予以 更 新 。 装 修 工 人 们 在 前 往 商 店 选 购 新 的 
瓷砖 时 ， 发 现 商 店 目前 只 供应 长 方形 的 瓷砖 ， 现 在 的 一 块 长 方形 瓷砖 相 
当 于 原来 的 两 块 正方 形 瓷砖 ， 工 人 们 拿 不 定 主 意 该 买 多 少 了 ， 读 者 朋友 
们 请 帮忙 分 析 一 下 : 能 否 用 1x2 的 瓷砖 去 覆盖 NxM 的 地 板 呢 ? 
分 析 与 解法 

NxM 的 地 板 有 如 下 几 种 可 能 : 

1. 如 果 N= 二 1，M 为 偶数 的 话 ， 显 然 ，1x2 的 瓷砖 可 以 覆盖 1xM 的 地 
板 ， 在 这 种 情况 下 ， 共 需要 M/2 块 瓷砖 。 

2. 如 果 NxM 为 奇数 ， 也 就 是 N 和 M 都 为 奇数 ， 则 肯定 不 能 用 1x2 的 
瓷砖 去 覆盖 它 。 证 明 : 假设 能 够 用 k 块 1x2 的 瓷砖 去 覆盖 NxM (N、M 都 
为 奇数 ) 的 地 板 ， 设 每 块 瓷砖 的 面积 为 1x2， 那 么 总 的 地 板 面 积 就 为 2k 
必 为 偶数 ， 又 因为 N、M 都 为 奇数 ， 也 就 是 NxM 的 地 板 面 积 肯 定 为 
奇数 ， 与 1x2 的 瓷砖 所 能 覆盖 的 面积 相 矛 盾 ， 所 以 肯定 不 能 用 1x2 的 瓷砖 
去 覆盖 它 。 

3. N 和 M 中 至 少 有 一 个 为 偶数 ， 不 妨 设 MX 为 偶数 ， 那 么 既然 我 们 可 
以 用 1x2 的 地 板 覆 盖 1xM 的 地 板 ， 也 就 可 以 简单 地 重复 N 次 覆盖 1xM 的 地 
板 的 做 法 ， 即 可 覆盖 NxM 的 地 板 。 


扩展 问题 
求 用 1x2 的 瓷砖 覆盖 2xM 的 地 板 有 几 种 方式 ? 


设 用 1x2 的 瓷砖 覆盖 2xM 的 地 板 有 F (M) 种 方式 ， 其 中 F 为 M 的 团 
数 ， 那 么 第 一 块 瓷砖 的 放 法 如 图 4-1、 图 4-2 所 示 : 


图 4-1 ”第 一 块 瓷砖 坚 着 放 ， 如 图 中 阴影 部 分 所 示 


图 4-2 ”第 一 块 瓷砖 横着 放 ， 如 图 中 阴影 部 分 所 示 


通过 对 图 4-1、 图 4-2 的 简单 分 析 ， 我 们 知道 第 一 块 瓷砖 的 放 法 ， 要 么 
是 坚 着 放 ， 要 么 是 横着 放 。 

当 第 一 块 瓷砖 竖 着 放 的 时 候 ， 问 题 转换 成 求 用 1x2 的 瓷砖 覆盖 剩 下 的 
2x (M 一 1) 的 方式 ， 即 F (M 一 1) 。 

当 第 一 块 瓷砖 横着 放 的 时 候 〈 必 有 另 一 块 瓷砖 放 在 其 正 下 方 ， 如 图 
中 阴影 所 示 ) ， 问 题 转换 成 求 用 1x2 的 瓷砖 覆盖 剩 下 的 2x (M 一 2) 的 方 
式 ， 即 F (M 一 2) 。 

在 求 F (M 一 1) 和 F (M 一 2) 时 ， 由 于 第 一 列 地 板 的 覆盖 方式 已 经 
不 同 , F (M 一 1) 种 覆盖 方式 和 F (M 一 2) 中 覆盖 方式 没有 重 亚 ， 故 F 
(M) =F (M 一 1) +F (M 一 2) ， 其中, F (1) =1, F (2) =2。 

读者 朋友 们 不 妨 思 考 一 下 这 个 问题 的 推广 形式 又 该 如 何 解 答 : 

1. 用 1x2 的 瓷砖 覆盖 8x8 的 地 板 ， 有 多 少 种 方式 呢 ? 如果 是 NxM 的 
地 板 呢 ? 

2. 用 pxq 的 瓷砖 能 够 覆盖 MxN 的 地 板 吗 ? 


4.3“” 买 票 找 零 


在 一 场 激 烈 的 足球 赛 开 始 前 ， 售 票 工作 正在 紧张 地 进行 中 。 每 张 球 
票 为 50 元 。 现 有 2n 个 人 排队 购 票 ， 其 中 有 n 个 人 手持 50 元 的 钞票 ， 另 外 n 
个 人 手持 100 元 的 钞票 ， 假 设 开始 售票 时 售票 处 没有 零钱 。 问 这 2n 个 人 有 
多 少 种 排队 方式 ， 不 至 使 售票 处 出 现 找 不 开 钱 的 局 面 ? 

分 析 与 解法 
[解法 一 】 

从 题目 中 可 以 推断 出 ， 只 有 手持 100 元 的 人 才 需 要 找 50 元 。 也 就 是 
说 ， 当 手持 100 元 的 球迷 到 达 售 票 处 时 ， 售 票 处 至 少 要 有 一 张 50 元 的 零 
钱 。 不 难看 出 ， 从 队 首 开始 往 后 数 ， 任 何 时 候 ， 只 要 手持 100 元 的 球迷 总 
比 手持 50 元 的 球迷 少 ， 肯 定 可 以 把 钱 找 开 。 

从 这 个 问题 可 以 联想 到 括号 匹配 问题 。 假 设 每 个 手持 50 元 的 球迷 是 
一 个 左 括号 “%(”， 而 手持 100 元 的 球迷 是 右 括号 “) ”， 要 求 任意 一 个 左 括 
号 都 要 有 一 个 右 括号 跟 它 对 应 。 类 似 的 ， 任 意 一 个 手持 100 元 的 球迷 ， 他 
从 售票 处 找 回 的 50 元 都 来 自 于 他 之 前 一 个 手持 50 元 的 球迷 。 所 以 ， 始 终 
找 得 开 钱 的 排队 方式 对 应 着 合法 的 括号 排列 。 

根据 解决 括号 匹配 问题 的 思路 ， 可 以 考虑 用 栈 来 解决 问题 。 假 设 存 
在 一 个 栈 ， 人 遍历 n 个 左 括号 (* 和 n 个 右 括号 “) ” 排 成 的 队列 ， 每 次 如 果 
是 左 括号 “(” (手持 50 元 的 球迷 ) ， 则 将 其 压 入 栈 中 ; 如 果 是 右 括号 
“ ” (手持 100 元 的 球迷 ) ， 则 让 栈 尾 的 左 括号 ”(〈(” (手持 50 元 的 球迷 ) 
出 栈 ， 如 果 始 终 能 够 保证 栈 中 有 足够 的 左 括号 ， 那 么 该 排列 是 一 个 合 ; 
的 排列 。 

因此 ， 可 以 做 这 样 的 分 析 。 第 一 个 符号 一 定 是 左 括号 ， 否 则 该 队列 
肯定 出 错 。 假 设 第 一 个 左 括号 跟 第 k 个 符号 匹配 。 那 么 从 第 2 个 符号 到 第 

(k 一 1) 个 符号 ， 第 (k 十 1) 个 符号 到 第 2n 个 符号 也 都 是 一 个 合法 的 括 
号 序列 。 可 想 而 知 ，k 肯 定 是 奇数 。 否 则 ， 第 2 个 符号 到 第 (k 一 1) 个 符 
号 之 间 只 有 奇数 个 符号 就 不 合法 ， 设 k=2i 十 1 (i=0, ..., n 一 1) 。 


如 图 4-3 所 示 : 


0 | 2i i+ ee pn-1 


图 4-3 ”括号 排列 示意 图 


假设 2n 个 符号 中 合法 的 括号 序列 之 个 数 为 f (2n) ， 若 第 一 个 左 括号 
与 第 k=2i 十 1 (i 二 0，1，...，n 一 1) 个 右 括 号 匹配 ， 那 么 剩余 括号 的 合 
法 序列 为 : f (2i) *f (oi 2i 一 2) 个 ， 根 据 上 面 的 分 析 ， 可 以 得 到 如 下 
递 推 式 : 


OZR $F £02) fC2n -2i—2) 
=f(0)*f(2n2)+f(2)*f(2n—-4)+""+f(2n4)*f(2)+f(2n-2)*f(0) 
(其 中 f (0) = 二 1) 。 这 样 我 们 可 以 用 O (n*n) 的 时 间 求 出 问题 的 答 


半 


我 们 可 以 根据 上 述 递 推 式 ， 进 一 步 得 到 通 项 公式 : f(2n)= 
ee 


用 另 一 种 解法 得 到 同样 的 答案 。 
【解法 二 】 


为 了 便于 描述 ， 这 里 用 1 表示 持 有 50 元 的 球迷 ， 用 0 表示 持 有 100 元 的 
球迷 。 那 么 2n 个 球迷 的 排队 就 对 应 na 个 1 和 n 个 0 的 排列 ， 例 如 : 1，1，0， 
0，0，...，1。 如 果 序 列 的 任意 前 k (k= 二 1，2，...，2n 一 1) 项 中 1 的 个 数 
都 不 少 于 0 的 个 数 ， 我 们 称 这 样 的 一 个 序列 是 合法 的 ， 否 则 称 其 为 非法 
的 。 显 然 合法 的 序列 正好 与 可 行 的 排列 方式 一 一 对 应 。 同 时 ， 称 由 n 一 1 
个 1 和 n 十 1 个 0 组 成 的 序列 为 sigma 序 列 (这 个 名 字 没有 任何 特别 的 意 
义 ) ， 这 样 的 序列 共有 | ”| 个 ， 我 们 会 在 后 面 用 到 。 


n 个 1 和 "个 0 总 的 排列 数 为 ”| (2n 个 位 置 ， 选 择 n 个 给 1， 剩 下 的 n 


个 给 0 就 可 以 了 ) ， 即 合法 序列 数 和 非法 序列 数 的 总 和 。 我 们 需要 求解 合 
法 的 序列 数 ， 但 在 尝试 后 会 发 现 直 接 求 解 合 法 序列 并 不 是 一 个 好 的 主 
意 ， 那 就 试 着 来 求解 非法 序列 吧 。 

由 定义 知道 ， 在 一 个 非法 序列 中 ， 存 在 某 个 ( 些 ) k， 使 得 序列 前 k 
项 中 1 的 个 数 少 于 0 的 个 数 。 更 进一步 地 ， 存 在 某 个 ( 些 ) k， 使 得 序列 前 
k 项 中 1 的 个 数 比 0 的 个 数 刚好 少 1 个 〈 想 一 想 为 什么 ) 。 取 其 中 最 小 的 k， 
使 得 前 k 项 中 1 的 个 数 比 0 的 个 数 刚 好 少 1 个 。 那 么 这 个 序列 的 后 2n 一 k 项 中 
1 的 个 数 会 刚好 比 0 的 个 数 多 1 个 。 将 后 2n-k 项 的 0 换 为 1，1 换 为 0， 于 是 得 
到 一 个 新 的 序列 : 由 n 一 1 个 1 和 n 十 1 个 0 组 成 一 个 Sigma 序 列 。 我 们 已 经 成 
功 地 将 一 个 非法 序列 对 应 到 唯一 一 个 Sigma 序 列 。 

那么 一 个 Sigma 序 列 能 唯一 地 对 应 到 一 个 非法 序列 么 ? 对 任意 一 个 
Sigma 序 列 ， 存 在 某 个 ( 些 ) k， 使 得 序列 的 前 k 项 中 1 的 个 数 少 于 0 的 个 数 
(因为 只 有 n 一 1 个 1， 而 有 n 十 1 个 0) 。 更 进一步 地 ， 存 在 某 个 ( 些 ) k， 
使 得 序列 的 前 k 项 中 1 的 个 数 比 0 的 个 数 刚 好 少 1 个 〈 想 一 想 这 又 是 为 什 
么 ) 。 取 其 中 最 小 的 k， 使 得 前 k 项 中 1 的 个 数 比 0 的 个 数 刚 好 少 1 个。 那么 
这 个 序列 的 后 2n 一 k 项 中 1 的 个 数 会 刚好 比 0 的 个 数 少 1 个 。 将 后 2n 一 k 项 的 
0 换 为 1，1 换 为 0， 于 是 得 到 一 个 新 的 序列 : 由 n 个 1 和 n 个 0 组 成 。 而 这 个 
序列 正 是 一 个 非法 的 序列 〈 因 为 前 k 项 中 1 的 个 数 比 0 少 ) 。 我 们 又 成 功 地 
将 一 个 Sigma 序 列 对 应 到 唯一 一 个 非法 序列 。 

由 此 我 们 知道 ， 非 法 序列 和 Sigma 序 列 是 一 一 对 应 的 。 非 法 的 序列 个 


(2 二 帮 1 


效 为 |; 合法 的 序列 数 ， 也 就 是 可 行 的 排队 方式 数 则 为 : 
(2*n) 2#n 1 1 (2*n) 

| n 一 也 FF n+l\n 

扩展 问题 


1. 矩阵 连 乘 问题 : P= 二 al xa, xas x...xan ， 依 据 乘 法 结合 律 ， 不 改变 
矩阵 的 相互 顺序 ， 只 用 括号 表示 成 对 的 乘积 ， 试 问 有 几 种 括号 化 的 方 


一 
菜 ? 


2. 将 多 边 形 划分 为 三 角形 问题 。 求 一 个 凸 多 边 形 区 域 划分 成 三 角形 
区 域 的 方法 数 。 

与 此 题 类 似 的 题目 1: 某 个 城市 的 某 个 居民 ， 每 天 他 需要 走 2n 个 街 
区 去 上 班 《他 在 其 住所 以 北 n 个 街区 和 以 东 n 个 街区 处 工作 ) 。 如 果 他 从 
不 穿越 《但 可 以 碰 到 ) 从 家 到 办 公 室 的 对 角 线 ， 那 么 有 多 少 条 可 能 的 道 
路 ? 

与 此 题 类 似 的 题目 2: 在 圆 上 选择 2n 个 点 ， 将 这 些 点 成 对 连接 起 
来 ， 求 使 所 得 到 的 n 条 线段 不 相交 的 方法 数 。 

3. n 个 结 点 可 构造 多 少 个 不 同 的 二 叉 树 。 


4.4 ”所 是 否 在 三 角形 内 


如 果 在 一 个 二 维 坐标 系 中 ， 已 知 三 角形 三 个 点 的 坐标 ， 那 么 对 于 坐 
标 系 中 的 任意 一 点 ， 如 何 判断 该 点 是 否 在 三 角形 内 (点 在 三 角形 边线 上 
也 认为 在 三 角形 内 ) ? 

假设 三 角形 的 三 个 点 的 坐标 为 ABC 〈 逆 时 针 顺 序 ) ， 需 要 判断 点 D 
是 否 在 该 三 角形 内 。 

这 个 问题 比较 简单 ， 但 是 可 以 通过 多 种 有 趣 的 思路 来 避免 采用 复杂 
的 计算 方式 。 

分 析 与 解法 

当 你 开始 解答 此 题 时 ， 很 可 能 会 直接 研究 这 个 任意 点 与 三 角形 的 三 
个 顶点 或 三 条 边 之 间 的 关系 ， 进 而 做 出 判断 。 在 试 着 摆 放 时 ， 你 可 能 会 
发 现 ， 利 用 垂 线 的 交点 可 以 进行 分 析 (如 图 4-4 所 示 ) : 
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图 4-4 ”利用 垂 线 信息 判断 点 与 三 角形 的 关系 


从 图 4-4 中 可 以 直观 地 分 析出 ， 如 果 点 D 在 三 角形 内 ， 则 所 有 的 垂 线 
交点 都 在 三 角形 的 边线 之 内 。 而 如 果 点 DD 在 三 角形 之 外 ， 则 垂 线 的 交点 
就 会 在 三 角形 边线 的 延长 线 上 。 

但 图 4-4 的 情况 是 否 具 有 通用 性 呢 ? 且慢 ! 我 们 再 考虑 其 他 情况 看 
看 。 如 图 4-5 所 示 ， 如 果 D 点 很 靠近 三 角形 ， 或 者 此 三 角形 是 钝 角 三 角 
形 ， 那 我 们 上 面 的 “直观 分 析 ” 都 是 不 对 的 ， 看 来 我 们 的 第 一 次 尝试 并 不 
可 取 。 


图 4-5” 垂 足 全 部 在 三 角形 以 内 的 情况 
【解法 一 】 
我 们 再 研究 点 和 线段 之 间 的 关系 ， 可 以 考虑 把 点 D 和 其 他 的 三 个 点 
连接 起 来 进行 分 析 。 也 就 是 利用 图 4-6 的 图 形 来 分 析 这 个 问题 : 


A 人 


B ， C B ， 光 
图 4-6 ”利用 面积 来 判断 点 与 三 角形 的 关系 


从 图 中 可 以 看 出 ， 这 个 问题 可 以 非常 直观 地 转化 为 比较 三 角形 的 面 
只 来 判断 点 的 位 置 ， 即 通过 比较 三 角形 ABC 的 面积 与 三 角形 ABD、 
BCD、CAD 面 积 之 和 的 大 小 来 判断 点 是 否 在 三 角形 内 。 

设 S 二 Area (ABC) 、S 二 Area (ABD) 、S, =Area (BCD) 、5; 
二 Area (CAD) 。 

如 果 S=Si 十 S, 十 S; ， 那 么 点 D 在 三 角形 ABC 的 内 部 或 边 上 ; 如 果 
Si 十 $, 十 S3 >S， 则 点 D 在 三 角形 外 部 。 

按照 这 种 算法 ， 计 算 量 会 大 大 减少 。 
代码 清单 4-1 


double 
is 
] le Area (pt F 1 )t ) 
/ 边 长 
double a, 1 ) 
/ 计算 出 三 角形 边 长 ， 分 别 为 a、b、c 
Computer (A, B, C, a, b, c) 
1 -6 ) 
turn sgrt((p a) (F b) (Pp ) p) 年 伦 公式 
} 
// 如 果 D 在 三 角形 内 ， 返 回 true， 耕 则 返回 false 
bool isInTriangle (point A, point B, point C, point D) 
{ 
/ Area (A，B，C) 函数 返回 以 A、B、C 为 项 点 的 三 角形 的 面积 
if (Area(lA, B, D) + Area(lB, C, D) + Areal(C, A, D) > Area (A, B, C)) 
r urn fa 
n ] 
} 


注 : 此 处 利用 了 浮 点 计算 来 判断 if (Area (A，B，D) 十 Area (B， 
C, D) 十 Area (C，A，D) >Area (A，B，C) ) ， 由 于 浮 点 有 精度 问 
题 ， 有 可 能 计算 有 误差 。 但 是 ， 这 不 是 本 题 的 重点 ， 它 不 会 影响 读者 理 
解 逻 辑 。 
【解法 二 】 

仍然 考虑 从 点 和 直线 之 间 的 关系 着 手 ， 从 下 面 的 图 4-7 中 ， 我 们 可 发 
现 如 下 的 规律 : 


图 4-7 利用 点 与 直线 的 关系 
由 于 三 角形 是 凸 的 ， 所 以 如 果 有 一 个 点 D 在 三 角形 ABC 内 ， 那 么 沿 
着 三 角形 的 边界 逆 时 针 走 ， 点 D 一 定 保持 在 边界 的 左边 ， 也 就 是 说 点 D 在 
边 AB、BC、CA 的 左边 。 
判断 一 个 点 Ps 是 否 在 一 条 射线 P; P, 的 左边 ， 可 以 通过 P| P; ，P]1 Ps 
两 个 向 量 叉 积 的 正 负 来 判断 。 如 图 4-8 所 示 : 


P1 
图 4-8 ”点 关系 的 矢量 表示 
如 果 叉 积 为 正 ， 则 P。 在 射线 P; P, 的 左边 ; 如 果 叉 积 为 负 ， 则 P。 在 
射线 P; P, 的 右边 ; 如 果 叉 积 为 0， 则 了 P。 在 射线 P; P, 上 。 
代码 清单 4-2 


//A，B，C 在 道 时 针 方 问 
/7 如果: A Ea 返回 false， 耕 则 返回 tx 


注 : 此 处 依赖 于 A、B、C 的 位 置 关 系 ， 其 位 置 不 能 调换 
isInTriangle (point A, point B, point CC, point D) 
(Prod (A, ) gS& Product (I ) P 人 
= 
rt rue; 
lt 


扩展 问题 


如 果 不 包括 点 在 边线 上 的 情形 ， 这 些 解 法 需要 做 什么 修改 ? 
若 要 判断 一 个 点 是 否 在 一 个 凸 多 边 形 内 呢 ? 


进一步 ， 如 何 判断 一 个 点 是 否 在 一 个 不 自 交 多 边 形 (不 保证 为 巴 


的 ) 内 ? 
或 者 又 怎么 判断 一 个 点 是 否 在 一 个 四 面体 内 呢 ? 


4.5 ”磁带 文件 存放 优化 


磁带 是 一 种 线性 存储 设备 ， 一 个 文件 在 磁带 上 的 存储 区 域 是 完整 而 
且 连 续 的 ， 而 多 个 文件 的 存储 区 域 是 相互 独立 且 连 续 分 布 的 ， 如 图 4-9 所 
示 。 与 今天 大 量 使 用 的 磁盘 式 存储 设备 不 同 ， 磁 带 没 有 扇 区 、 柱 面 、 磁 
道 等 概念 ， 所 以 在 进行 文件 寻 址 时 需要 耗费 线性 时 间 ， 即 要 定位 到 磁带 
上 的 第 n 个 文件 ， 需 要 依次 经 过 前 面 的 n 一 1 个 文件 的 磁带 长 度 。 如 今 ， 磁 
盘 式 存储 设备 一 般 能 以 低 于 线性 时 间 的 效率 进行 寻 址 ， 但 是 磁带 式 存储 
设备 因 其 低廉 的 价格 ， 简 单 的 存储 结构 以 及 海量 的 存储 空间 ， 在 今天 依 
然 被 许多 数据 中 心 选 为 数据 备份 设备 。 


图 4-9 ”文件 在 磁带 上 呈 线 性 分 布 


大 型 的 数据 中 心 一 般 会 采用 一 个 磁带 SAN (Storage Area Network， 
存储 区 域 网 络 ) 作为 备份 设备 (如 图 4-10 所 示 ) 。 假 设 其 中 一 盘 磁带 上 
有 n 份 文件 ， 它 们 的 长 度 分 别 为 L[0]，L[1]，...，L[n 一 1]， 且 被 访问 的 概 
率 分 别 为 PI[0]，P[1]，...，P[n 一 1]。 如 果 这 些 文件 被 访问 的 概率 相等 ， 那 
么 请 问 怎样 安排 它们 在 磁带 上 的 存储 顺序 最 好 ? 


图 4-10 一 台 上 典型 的 大 型 磁带 备份 设备 示意 图 


分 析 与 解法 

首先 ， 我 们 要 考虑 的 是 ， 何 谓 “ 最 好 ”的 存储 顺序 ? 之 前 有 提 到 ， 磁 
带 是 一 种 线性 存储 设备 ， 对 存储 于 其 上 的 第 n 个 文件 的 寻 址 需要 先 经 过 前 
面 n 一 1 个 文件 的 磁带 长 度 ， 时 间 复 杂 度 为 O(N) 。 那 么 ， 如 果 能 找到 一 
种 文件 存储 顺序 ， 使 得 访问 这 些 文件 所 需 经 过 的 平均 磁带 长 度 最 短 ， 那 
么 就 可 以 获得 “最 佳 " 的 访问 效率 ， 也 就 是 所 谓 的 “最 好 ”存储 顺序 。 

根据 概率 论 里 数学 期 望 的 定义 ， 访 问 这 些 文件 的 平均 长 度 为 : 

ECL)=D, Pl 2 UL ( 式 1) 


如 果 这 些 文件 被 访问 的 概率 相等 ， 即 P[i]=p 〈i 王 0，1，...，n 一 
1) ， 则 有 : 


n-1 i 
E(Lj=p >》 芝 LD 
LI=0 J=0 


=p*{n*L0]+(n-1)*L1]+…+L(n-1))} ( 式 2) 

L[j] 表 示 排 在 第 j 个 位 置 的 文件 之 长 度 

P 中 表示 排 在 第 i 个 位 置 的 文件 被 访问 的 概率 

从 式 2 中 可 以 看 出 ， 要 让 E (L) 最 小 ， 只 要 让 {n*L[0] 十 (n 一 1) 
*L[1] 十 ... 十 L (n 一 1) } 最 小 即 可 ， 也 就 是 让 被 乘 次 数 最 多 的 文件 长 度 最 
短 ， 次 多 的 文件 长 度 次 短 ， 依 次 递增 文件 长 度 。 用 一 句 话 来 概括 ， 就 是 
按照 文件 长 度 由 短 到 长 地 将 文件 存储 到 磁带 上 ， 即 可 得 到 最 佳 访 问 效 

如 果 这 些 文件 的 长 度 一 样 ， 而 访问 的 概率 各 不 相同 ， 又 该 按 何 种 存 
储 顺 序 存储 文件 呢 ? 

同上 一 个 问题 的 分 析 思 路 一 样 ， 我 们 先 求 出 这 些 E (L) 的 表达 式 ， 
因为 L[i]==1 (i=0，1，...，n 一 1) ， 有 : 


六 一 ] 
六 共产 让 2 fp 加 + (i+ 1)*1) 


n—1 
ss 2 (PLi] * (i+ 1)} ( 式 3) 


从 式 3 中 可 以 看 出 ， 按 访问 概率 从 大 到 小 排列 文件 最 好 。 这 样 可 以 保 
证 查找 的 平均 长 度 最 小 。 


如 果 文 件 长 度 和 被 访问 的 概率 都 不 同 ， 何 种 存储 顺序 又 是 最 好 的 
呢 ? 
从 推导 式 中 可 以 看 出 : 


n~—1 i 

ECL)=), CP * >, AUD 

我 们 可 以 先 用 一 个 具体 的 例子 来 计算 一 下 ， 看 看 能 不 能 发 现 什么 规 
律 : 

假设 有 两 个 文件 A 和 B， 其 长 度 L 分 别 为 10、6， 而 被 访问 概率 P 为 

0.4、0.6。 

那么 ， 把 文件 B 排 在 文件 A 前 面 。 这 样 平均 访问 长 度 为 0.6*6 十 0.4* 
(6 十 10) 三 10。 

由 于 我 们 没有 办 法 直接 利用 文件 的 长 度 和 访问 概率 来 进行 分 析 ， 那 
么 我 们 可 以 利用 概率 二 访问 长 度 的 关系 来 进行 分 析 。 

对 于 上 述 例子 来 说 ， 第 一 个 文件 的 PL 二 0.6/6 二 0.1， 第 二 种 文件 的 
P/L=0.4/16=0.025。 

而 如 果 文件 A 在 文件 B 前 面 ， 平 均 访问 长 度 为 0.4*10 十 0.6* (6 十 10) 
一 13.6。 

其 中 ， 第 一 个 文件 的 P/L= 二 0.4/10 二 0.04， 第 二 个 文件 的 P/L 二 0.6/16 
一 0.0375。 

同样 ， 我 们 可 以 根据 上 面 的 推导 ， 判 断 出 P[i 拭 外 的 值 从 大 到 小 排列 
即 为 最 佳 存 储 顺 序 。 


4.6 ” 桶 中 取 黑 白 球 


有 一 个 桶 ， 里 面 有 白 球 、 黑 球 各 100 个 ， 人 们 必须 按照 以 下 的 规则 把 
球 取出 来 : 

1. 每 次 从 桶 里 面 拿 出 来 两 个 球 。 

2. 如 果 是 两 个 同色 的 球 ， 就 再 放 入 一 个 黑 球 。 

3. 如 果 是 两 个 异 色 的 球 ， 就 再 放 入 一 个 白 球 。 

问 : 最 后 桶 里 面 只 剩 下 一 个 黑 球 的 概率 是 多 少 ? 
分 析 与 解法 


拿 到 这 个 问题 的 时 候 ， 非 常 多 的 读者 可 能 会 被 “100” 这 个 数字 吓 倒 ， 
然后 陷入 痛苦 的 思索 中 。 是 不 是 要 记录 几 百 次 的 操作 才 可 能 得 到 结果 
呢 ? 该 怎么 处 理 球 的 不 同 组 合 呢 ? 在 分 析 这 种 问题 的 时 候 ， 如 果 仅 仅 依 
靠 枚 举 的 思路 来 进行 分 析 ， 很 难得 到 期 望 的 结果 。 相 反 ， 如 果 先 通过 规 
模 比 较 小 的 情况 (比如 假设 黑白 球 各 10 个 、 各 5 个 甚至 各 2 个 ) 来 进行 分 
析 和 推断 ， 然 后 找 出 其 内 在 的 规律 ， 并 归纳 总 结 ， 答 题 就 会 比较 容易 
了 。 

[解法 一 】 

因此 ， 让 我 们 从 题目 条 件 出 发 ， 先 让 自己 的 脑海 中 浮现 出 一 个 大 
桶 ， 桶 里 面 有 白 球 和 黑 球 各 两 个 ， 然 后 开始 取 球 。 

为 了 更 好 地 描述 问题 ， 我 们 可 以 用 一 个 set ( 黑 球 数目 ， 白 球 数目 ) 
来 表示 桶 里 面 黑 球 和 白 球 的 个 数 。 对 于 每 种 球 各 两 个 的 情况 ， 就 可 以 把 
桶 内 黑 球 、 白 球 表示 为 (2，2) ， 第 一 个 数 表示 黑 球 的 数目 ， 第 二 个 数 
表示 白 球 的 数目 。 如 果 是 从 中 取出 两 个 黑 球 ， 我 们 可 以 用 (-2，0) 来 表 
示 黑 球 数目 减少 了 两 个 ， 而 白 球 的 数目 不 变 。 类 似 地 ， (0，-2) 用 来 表 
示 减 少 了 两 个 白 球 ， 而 黑 球 的 数目 不 变 。 为 了 方便 题目 的 描述 ， 我 们 可 
以 通过 定义 如 下 的 关系 来 说 明 对 球 的 操作 : 

(a, b) 十 (x, y) = (a+x, b+y) 

(a, b) 一 (x, y) = (a-x, b-y) 


这 样 ， 每 次 对 球 的 操作 ， 都 可 以 表示 为 相应 的 符号 操作 。 

根据 获取 黑白 球 的 规则 ， 我 们 可 以 得 到 如 下 推论 : 

1. 由 于 每 次 取出 两 个 球 之 后 ， 均 只 会 放 回 一 个 球 ， 那 么 ， 每 经 过 一 
次 操作 ， 桶 内 球 的 总 数 会 减少 一 个 。 也 就 是 说 ， 球 的 个 数 肯 定 会 逐步 减 
少 ， 最 后 减少 的 规模 应 该 在 我 们 可 控 的 范围 之 内 。 

2. 从 桶 中 取出 两 个 球 之 后 ， 只 可 能 是 进行 下 列 三 种 操作 之 一 种 : 

取出 的 是 两 个 黑 球 ， 则 放 回 一 个 黑 球 : (〈-2，0) 十 (1, 0) = 
(-1，0) 

取出 的 是 两 个 白 球 ， 则 放 回 一 个 黑 球 : (0，-2) 十 (1, 0) = 
(1，-2) 
取出 的 是 黑 球 白 球 各 一 个 ， 则 放 回 一 个 白 球 : (-1，-1) 十 (0，1) 
(-1，0) 
根据 上 面 的 规则 ， 对 于 (2，2) 的 情况 : 
第 一 次 操作 之 后 ， 结 果 是 (1，2) 或 (3，0) 。 
第 二 次 操作 之 后 : 
对 于 (1，2) 的 情况 : 如 果 是 取 两 个 白 球 ， 那 么 剩 下 的 球 为 (2， 
0) ; 如 果 各 取 一 个 ， 那 么 结果 为 (0，2) 。 

对 于 (3，0) 的 情况 : 只 能 取 两 个 黑 球 ， 那 么 结果 显然 为 (2， 
0) 。 

第 三 次 操作 之 后 : 

对 于 (2，0) 的 情况 ， 结 果 只 能 为 (1，0) 。 

对 于 (0，2) 的 情况 ， 结 果 同 样 也 只 能 为 (1，0) 。 

从 上 面 的 推断 可 以 看 出 : 

1. 每 次 都 会 减少 一 个 球 ， 那 么 最 后 的 结果 肯定 是 桶 内 只 剩 一 个 球 。 
要 么 是 黑 球 ， 要 么 是 白 球 。 

2. 每 次 拿 球 后 ， 白 球 数量 要 么 不 变 ， 要 么 就 是 两 个 两 个 地 减少 。 

所 以 从 上 面 的 分 析 可 以 得 出 ， 最 后 不 可 能 剩余 一 个 白 球 ， 那 么 必然 
只 能 是 黑 球 了 。 


【解法 二 】 


前 面 的 分 析 似 乎 过 于 具体 ， 我 们 从 数学 的 角度 抽象 一 下 ， 再 次 回 过 
头 来 看 题目 条 件 : 

1. 如 果 是 两 个 同色 的 球 ， 就 再 放 入 一 个 黑 球 。 

2. 如 果 是 两 个 异 色 的 球 ， 就 再 放 入 一 个 白 球 。 

根据 上 面 两 个 条 件 ， 可 以 类 似 地 想到 离散 数学 中 的 异 或 (XOR) : 

两 个 相同 的 数 ， 异 或 等 于 0。 

两 个 不 同 的 数 ， 异 或 等 于 1。 

由 于 当 球 不 同时 ， 就 可 以 再 放 入 一 个 黑 球 。 那 么 我 们 只 能 把 黑 球 赋 
值 为 0， 白 球 赋值 为 1 了 。 

脑海 中 浮现 的 大 桶 中 将 不 再 装着 黑 球 和 白 球 ， 而 是 100 个 1 和 100 个 
0。 

对 于 每 次 操作 可 以 做 这 样 的 抽象 : 每 次 捞 出 两 个 数字 做 一 次 异 或 操 
作 ， 并 将 所 得 的 结果 〈1 或 0) 丢 回 桶 中 。 这 样 每 次 操作 的 过 程 都 不 会 改 
变 所 有 球 的 权 值 的 异 或 值 。 

同样 可 以 考虑 用 比较 少 的 数据 来 说 明 这 个 问题 。 

假设 黑 、 白 球 各 两 个 ， 参 数 为 (2，2) ， 假 设 操作 过 程 如 下 : 

1. 取出 两 个 黑 球 ， 放 回 一 个 黑 球 。0 XOR 0 二 0， 剩 下 的 结果 为 
(1, 2) 。 

2. 取出 一 黑 一 白 ， 放 回 一 个 白 球 。0 XOR 1 二 1， 剩 下 的 结果 为 
(0，2) 。 

3. 最 后 只 能 取出 两 个 白 球 。1 XOR 1=0， 剩 下 的 结果 为 (1，0) 。 

因为 异 或 满足 结合 律 ， 即 (a XOR b) XOR c=a XOR (bXOR 
c) ， 那 么 上 面 操作 的 顺序 并 不 会 影响 到 后 面 的 结果 。 

从 上 面 的 推导 中 可 以 看 出 ， 取 球 的 过 程 相 当 于 把 里 面 所 有 的 球 进行 
异 或 操作 ， 也 就 是 说 1 XOR 1 XOR 0 XOR 0=0。 

因此 ， 剩 下 一 个 球 的 时 候 ， 桶 中 的 权 值 等 于 初始 时 刻 所 有 球 权 值 的 
异 或 值 ， 也 就 是 0。 所 以 剩 下 一 个 球 的 时 候 一 定 是 黑 球 。 

从 上 面 的 解法 可 以 看 出 ， 对 于 复杂 问题 的 分 析 ， 最 有 效 的 方法 就 是 
通过 简单 的 例子 进行 分 析 归 纳 ， 然 后 根据 实际 归纳 出 的 结论 进行 结果 分 
析 。 而 适当 的 数学 抽象 在 解决 问题 的 过 程 中 往往 有 画龙点睛 的 作用 。 


扩展 问题 


1. 如 果 桶 中 球 的 个 数 为 黑白 各 99 个 ， 那 么 结果 会 怎样 ? 

根据 前 面 的 分 析 ， 我 们 已 经 清楚 地 知道 ， 可 以 通过 对 所 有 的 数字 进 
行 异 或 运算 来 得 到 结果 ， 最 后 异 或 运算 的 结果 为 1。 也 就 是 说 ， 最 后 会 剩 
下 一 个 白 球 。 

同样 ， 我 们 可 以 很 容易 地 发 现 : 如 果 是 每 种 球 的 个 数 为 偶数 ， 那 么 
最 后 剩 下 的 一 定 是 黑 球 ， 如果 球 的 个 数 是 奇数 ， 那 么 最 后 剩 下 的 一 定 是 
日 球 。 

2. 如 果 黑 日 球 的 数量 不 定 ， 那 么 结果 又 会 怎样 ? 

从 前 面 的 分 析 中 可 以 看 出 ， 事 实 上 ， 我 们 不 用 太 在 乎 球 的 数量 ， 只 
需 在 乎 异 或 运算 的 结果 就 行 了 。 因 此 ， 对 于 球 的 数目 任意 的 情况 ， 同 样 
只 需 看 最 后 异 或 运算 的 值 即 林 。 


4.7 ”蚂蚁 扑 杆 


有 一 根 27 厘 米 的 细 木 杆 ， 在 第 3 厘米 、7 厘 米 、11 厚 米 、17 厘 米 、23 
厘米 这 五 个 位 置 上 各 有 一 只 蚂蚁 。 木 杆 很 细 ， 不 能 同时 通过 两 只 蚂蚁 。 
开始 时 ， 蚂 蚁 的 头 朝 左 还 是 朝 右 是 任意 的 ， 它 们 只 会 朝 前 走 或 调头 ， 但 
不 会 后 退 。 当 任意 两 只 蚂蚁 碰头 时 ， 两 只 蚂蚁 会 同时 调头 朝 反 方向 走 。 
假设 蚂蚁 们 每 秒 钟 可 以 走 一 厘米 的 距离 。 编 写 程 序 ， 求 所 有 蚂蚁 都 离开 
木 杆 的 最 短 时 间 和 最 长 时 间 。 

分 析 与 解法 
【解法 一 】 

面试 中 有 些 问 题 ， 其 表面 上 的 复杂 性 ， 会 导致 应 聘 者 使 用 变 力 
(brute force) 的 方法 来 解决 。 对 于 这 道 题 ， 应 聘 者 可 能 会 考虑 枚 举 蚂蚁 
的 初始 朝向 ， 模 拟 每 一 个 蚂蚁 的 运动 来 解决 。 显 然 ， 程 序 将 既 缺乏 可 读 
性 ， 又 缺乏 灵活 性 和 效率 ， 显 然 不 足以 打动 面试 者 。 

[解法 二 】 

其 实 每 个 复杂 问题 的 背后 ， 都 有 一 些 简单 的 规律 ， 无 论 是 在 面试 中 
还 是 在 实际 工作 中 都 是 这 样 。 而 这 种 化 繁 为 简 的 能 力 正 是 面试 者 所 期 望 
的 。 问 题 是 求 所 有 蚂蚁 离开 木 杆 的 时 间 ， 并 不 需要 具体 蚂蚁 的 运动 信 
息 ， 因 此 就 有 了 利用 简便 方法 的 机 会 。 

首先 对 蚂蚁 的 运动 情况 进行 分 析 。 当 两 个 蚂蚁 健 头 的 时 候 ， 会 发 生 
怎样 的 情况 ? 

图 4-11 是 两 只 蚂蚁 碰头 过 程 的 示意 图 ， 从 上 到 下 分 别 为 碰头 前 、 碰 
头 、 碰 头 后 。 


图 4-11 ”蚂蚁 爬 杆 示意 图 


从 图 4-11 中 可 以 分 析出 ， 虽 然 两 个 蚂蚁 相遇 后 是 掉头 往 反 向 走 ， 但 
是 ， 可 以 “看 作 ” 是 两 个 蚂蚁 相遇 后 ， 控 肩 而 过 。 也 就 是 说 ， 可 以 认为 蚂 
蚁 的 运动 是 独立 的 ， 是 否 有 碰头 并 不 是 问题 的 重点 。 

这 样 ， 虽 然 每 个 蚂蚁 运动 的 轨迹 都 与 原来 不 一 样 了 ， 但 所 有 蚂蚁 离 
开 木 杆 的 最 短 时 间 和 最 长 时 间 是 不 变 的。 只 需 分 别 计算 每 个 蚂蚁 离开 木 
杆 的 时 间 ， 即 可 求 出 所 有 蚂蚁 离开 木 杆 的 时 间 了 。 

这 样 ， 程 序 只 需 遍 历 所 有 蚂蚁 ， 把 每 个 蚂蚁 走出 木 杆 的 最 长 时 间 
(蚂蚁 向 离 自 己 较 远 的 一 端 走 去 ) ， 最 短 时 间 (蚂蚁 向 离 自 己 较 近 的 一 
端 走 去 ) 分 别 求 出 来 ， 得 到 最 大 值 ， 就 是 所 有 蚂蚁 离开 木 杆 的 最 短 时 间 
和 最 长 时 间 。 

伪 代 码 如 下 : 
代码 清单 4-3 


void CalcTime (double Length, // length of the stick 


double *XPos, // position of an ant, <=length 

int AntNum, // number of ants 

double Speed, // Speed of ants 

double &Min， /!/ return value of the minimum time 
double g&Max) // return value of the maximum time 


//parameter checking. Omitted. 


//total time needed for traveling the whole stick 


double TotalTime Length / Speed; 
Max = Min = 0; 


A 


for(int i = 0; i < AntNum; i++) 
{ 
double currentMax = 0; 
double currentMin = 0; 
if{XPos[i] > (Length / 2)) 


currentMax = XPos{[i] / speed; 
else 

currentMax = (Length ~ Xpos[i]) / speed; 
CL GNC = TotalTime Max; 


if (Max < currentMax) 


Max = currentMax; 


if (Min < currentMin) 


Min = currentMin; 


} 


扩展 问题 


1. 第 i 个 蚂蚁 ， 什 么 时 候 走 出 木 杆 ? 

2. 如 果 蚂 蚁 在 一 个 平面 上 运动 ， 同 样 也 是 碰头 后 原 路 返回 (这 样 和 
弹性 碰撞 不 同 ， 没 有 相当 于 两 个 蚂蚁 交换 继续 前 进 的 本 质 ) ， 问 蚂蚁 如 
何 走出 平面 ? 

问 蚂蚁 一 共 会 磁 撞 多 ” 少 次 ? 


4. 两 人 A (速度 为 ai ，B (速度 为 b) 在 一 直路 上 相向 而 行 。 在 A、 
B 距 离 s 的 时 候 ，A 放 出 一 只 鸽子 C 《速度 为 ，C 飞 到 B 后 ， 立 即 调头 飞 
向 A， 遇 到 A 后 又 飞 向 B..….. 就 这 样 在 AB 间 飞 来 飞 去 ， 直 到 AB 相 遇 。 问 
这 期 间 鸽 子 共 飞 了 多 少 路 程 ? 

5. 轮船 (速度 为 a) 在 长 江 (速度 为 b) 里 逆流 而 上 行驶 。 某 个 时 
刻 ， 从 船上 落下 一 个 救生 图 到 水 中 。 一 个 小 时 后 ， 船 员 才 发 现 这 一 情 
况 ， 于 是 调头 去 找 。 问 什么 时 候 轮 船 可 找到 这 个 救生 圈 ? 


4.8 三 角形 测试 用 例 


前 来 面试 研发 职位 的 同学 大 部 分 都 觉得 “测试 ”是 一 个 很 容易 的 事 
情 ， 但 是 事实 并 非 如 此 。 测 试 和 开发 还 是 有 些 不 一 样 的 。 打 个 比方 ， 看 
到 一 杯 半 满 的 水 ， 从 乐观 的 角度 看 ， 会 觉得 一 一 杯子 一 半 都 满 了 ! 而 从 
悲观 的 角度 来 看 一 一 杯子 还 有 一 半 是 空 的 ! 测试 工程 师 必须 具备 从 各 种 
角度 看 问题 ， 找 出 可 能 缺陷 的 能 力 。 当 团队 中 别 的 同事 欢呼 “项目 快要 完 
成 了 ”的 时 候 ， 测 试 工 程 师 必 须 能 看 到 杯子 里 还 有 什么 地 方 是 空 的 。 

我 们 举 一 个 判定 三 角形 的 例子 : 输入 三 角形 的 三 条 边 长 ， 判 断 是 否 
能 构成 一 个 三 角形 〈 不 考虑 退化 三 角形 ， 即 面积 为 零 的 三 角形 ) ， 是 什 
么 样 的 三 角形 〈 直 角 、 锐 角 、 钝 角 、 等 边 、 等 腰 ) 。 

水 数 声明 为 : byte GetTriangleType(int，int，int)o 

1. 如 何 用 一 个 byte 来 表示 各 种 输出 情况 ? 

2. 如 果 你 是 一 名 测试 工程 师 ， 应 该 如 何 写 测试 用 例 呢 ? 


分 析 与 解法 
【问题 1 的 解法 】 


首先 我 们 把 需要 考虑 的 状态 可 简单 分 为 三 角形 和 非 三 角形 两 种 ， 其 
中 三 角形 又 包括 直角 、 锐 角 、 钝 角 、 等 边 、 等 腰 。 题 目 要 求 用 一 个 byte 
来 表示 各 种 输出 结果 ， 一 个 byte 为 8 位 bit， 能 够 表示 0 人 255， 即 一 个 byte 
可 以 表示 256 种 状态 ， 自 然 我 们 可 以 穷 举 所 有 可 能 的 三 角形 状态 ， 然 后 对 
其 一 一 编号 ， 如 将 非 三 角形 编号 为 0、 直 角 三 角形 编号 为 1、 锐 角 三 角形 
编号 为 2， 依 次 类 推 。 但 考虑 ， 一 个 直角 三 角形 同时 也 可 能 是 等 腰 三 角 
形 ， 一 个 等 边 三 角形 它 同时 也 是 锐角 三 角形 ， 那 么 在 上 述 编码 的 基础 
上 ， 要 想 表 述 更 精确 的 三 角形 状态 ， 需 要 继续 往 后 扩展 编码 。 但 这 样 的 
编码 方式 使 得 编码 结果 没有 规律 可 循 ， 容 易 造 成 记忆 混淆 。 有 没有 更 好 
的 表达 方式 呢 ? 我 们 可 以 考虑 按 标 志 位 编码 ， 将 1 个 byte 从 右 到 左 (或 者 
从 左 到 右 ) 依次 按 位 赋予 含义 ， 如 表 4-1， 第 0 位 表示 等 腰 ， 第 1 位 表示 等 
边 ， 等 等 。 各 位 取 1 表 示 该 状态 为 真 ， 其 中 第 7 位 表示 该 状态 是 否 为 三 角 


形 ， 是 则 为 1， 非 三 角形 则 为 0。 那 么 便 可 很 方便 地 表示 几 种 状态 同时 存 
在 ， 如 10010001 则 表示 这 是 一 个 等 腰 直 角 三 角形 。 剩 余 的 第 6 位 和 第 5 位 
可 以 留 作 错误 编码 ， 比 如 用 于 表示 两 边 之 和 大 于 第 三 边 等 ， 读 者 可 自行 
设计 ， 这 里 为 了 简单 起 见 ， 所 有 的 非 三 角形 我 们 只 将 三 角形 标志 位 (第 7 
位 ) 设置 为 0， 如 表 4-1 所 示 。 


表 4-1 


【问题 2 的 解法 】 

可 能 很 多 读者 会 认为 ， 具 备 初中 数学 常识 的 同学 都 能 比较 容易 地 写 
出 算法 。 从 测试 的 角度 来 看 ， 瑶 似 也 不 会 太 复杂 吧 ? 其 实 不 然 ， 作 为 一 
名 测试 者 ， 要 测试 一 个 程序 ， 具 体 的 工作 就 是 要 分 析 程 序 可 能 出 现 的 漏 
洞 ， 并 编制 测试 用 例 来 有 针对 性 地 进行 尝试， 观察 程序 是 否 正 常 工作 。 
通常 测试 可 分 为 以 下 三 个 方面 : 程序 在 正常 输入 下 的 功能 测试 ， 测 试 程 
序 在 非法 输入 时 的 表现 ， 测 试 程序 对 边界 值 附近 输入 的 处 理 。 对 于 “三 角 
形 判 定 ” 这 道 题目 ， 测 试用 例 看 起 来 应 该 是 这 样 的 : 

预期 输入 : a，b，c (三 个 数值 ， 代 表 三 条 边 的 长 度 ) 。 

预期 输出 : 采用 问题 1 中 的 编码 输出 ， 即 非 三 角形 或 三 角形 的 具体 状 


/NO 


1. 程序 在 正常 输入 下 的 功能 测试 ， 如 表 4-2 所 示 : 


表 4-2 
用 例 id | 输入 | 预期 输出 | 描述 
| (4,1,2) 00000000 上 三 角形 
2 (5.5755 10001011 等 边 三 角形 
3 C02.3) | 10000001 | _ 等 腰 三 角形 
4 (3,4,5) 10010000 直角 三 角形 
5 (2,3,4) | 10000100 | _ 钝 角 三 角形 
6 ( 100, 99, 2 ) 10001000 | ”锐角 三 角形 


备注 : 需要 交换 三 边 长 度 顺 序 以 确保 对 每 条 边 的 判断 ， 如 对 用 例 1 还 
需要 测试 (1，2，4) 及 (2，4，1) 等 5 组 用 例 (后 面 的 用 例 应 做 相同 的 


操作 ) 5 
2. 测试 程序 在 非法 输入 时 的 表现 ， 如 表 4-3 所 示 : 
表 4-3 
用 例 id 输入 预期 输出 描述 


8 Eales 00000000 0 值 


9 负 值 
10 类 型 错误 
3. 测试 程序 对 边界 值 附近 输入 的 处 理 (假设 1<=a, b, c<= 
100) ， 如 表 4-4 所 示 : 


表 4-4 
用 例 id 输入 预期 输出 | 描述 
1 10000001 等 腰 三 角形 
12 (50, 50, 2 ) 10000001 等 腰 三 角形 
13 ( 100, 100, 99 ) 10000001 等 采 三 角形 
14 ( 100, 100, 100 ) 10001011  ” | ”等 边 三 角形 


15 (50, 50, 100 ) 00000000 非 三 角形 


16 10001011 等 边 三 角形 
17 00000000 非 三 角形 
18 00000000 二 三 角形 
19 00000000 莫 三 角形 
提示 : 中 间 值 通常 应 该 确保 能 被 正确 处 理 ， 而 边界 值 则 往往 因为 判 
断 语句 使 用 <、> 还 是 <=、>= 而 引起 错误 。 
因为 篇 幅 关 系 ， 以 上 表格 中 尚未 包括 换 位 枚 举 。 对 于 一 个 简单 的 三 
角形 判定 问题 ， 测 试用 例 也 远 不 止 这 20 个 。 在 真正 严格 的 测试 中 ， 尤 其 
是 在 自动 化 测试 中 ， 为 了 测试 充分 ， 这 样 的 做 法 是 有 价值 而 且 必 要 的 。 
在 微软 的 笔试 题 里 曾 出 现 过 不 少 类 似 的 题目 ， 很 多 人 只 能 给 出 4~5 
个 测试 用 例 ， 事 实 上 ， 只 有 给 出 15~20 个 测试 用 例 才能 得 到 较 高 的 分 
数 。 


扩展 问题 


1. 如 果 三 角形 的 各 个 边 长 是 浮 点 数 ， 测 试用 例会 有 什么 变化 呢 ? 
2. 如 果 你 负责 测试 文本 编辑 软件 Word 的 “另存 为 …...” (Save 
As.…) 的 功能 ， 你 能 写 出 多 少 有 条 理 ， 有 组 织 的 测试 用 例 ? 


4.9 ” 数 独 知 多 少 


通过 前 面 的 题目 (1.15 节 “构造 数 独 *) 的 介绍 ， 相 信 大 家 都 已 经 很 熟 
悉数 独 游戏 了 ， 我 们 还 有 几 个 “小 ”问题 没有 解决 。 

图 4-12 是 一 个 已 完成 的 数 独 ， 可 以 看 出 ， 图 中 每 一 行 、 每 一 列 和 九 
个 3x3 的 小 矩阵 都 没有 重复 的 数字 出 现 。 


11213|41516|17|819| 
4151617|819|1|2|3| 
7.819|1|2|3|4|516 
121314|516|7|8|9|1| 
5|16|7|8|911121314| 
8|9|11213|415|6|7| 
314|516|7|819|1|2| 
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作品 


问题 

一 共有 多 少 种 不 同 的 数 独 解 答 呢 ? 其 中 有 多 少 种 是 独立 的 解答 呢 ? 

如 果 我 们 要 用 一 个 简单 的 字符 串 来 表示 各 种 数 独 (例如 : 上 面 的 数 
独 可 以 用 “125864...685219” 来 表示 ) ， 如 何在 保证 一 一 对 应 的 基础 上 ， 
让 字符 串 的 长 度 最 短 ? 

分 析 与 解法 

那么 有 多 少 种 数 独 的 解答 呢 ? 在 这 些 解答 中 ， 独 立 的 解答 有 多 少 
呢 ? 现在 我 们 假设 面试 者 给 你 出 了 这 个 问题 ， 你 也 许 会 想 阿 呀 ， 如 
果 我 提前 背 下 “ 数 独 总 数 ” 这 个 答案 和 证 明 就 好 了 ..…..….… 

其 实 ， 面 试 者 不 是 在 考 你 的 记忆 力 ， 面 试 者 要 看 到 的 是 应 聘 者 如 何 
思考 ， 如 何 着 手 解决 有 挑战 性 的 问题 。 

很 多 应 聘 者 听 到 这 个 问题 ， 就 陷入 了 沉思 ， 或 者 急忙 开始 演算 。 其 
实 解决 问题 的 第 一 步 ， 就 是 要 明确 问题 至 I 这 和 做 软件 项 目 类 
似 一 一 如 果 客 户 告诉 你 :“ 我 想 做 一 个 网 站 .……. 

你 不 会 马上 打 断 用 户 :“ 好 ! 不 要 再 说 了 ， 你 回去 吧 ， 三 个 月 后 网 站 
交付 ! ”你 会 进一步 去 问 ， 什 么 样 的 网 站 ? 网 站 要 解决 什么 问题 ? 用 户 是 
谁 ? 类 似 的 网 站 有 那些 .……. 

同样 ， 对 于 数 独 的 所 有 解答 ' 这 一 问题 ， 你 应 该 反问 : “独立 ”是 什 
么 意思? 所 有 解答 是 精确 到 个 位 数 的 答案 ， 还 是 一 个 估计 值 ? ” 

谈 到 “独立 ”， 就 要 研究 独立 的 定义 。 我 们 可 以 看 出 ， 任 意 交 换 数 独 
的 两 个 数字 > 上 图 中 所 有 “1” 都 变 成 “9”， 同 时 “9” 都 变 成 “<1”) ， 得 
到 的 仍 是 一 个 合法 的 数 独 解 答 。 那 么 ， 我 们 可 以 定义 : 如 果 两 个 数 独 解 
答 可 以 通过 这 样 方式 转换 得 到 对 广 ， 则 它们 不 是 独立 的 。 

基于 上 述 的 定义 ， 每 个 数 独 解答 都 可 以 通过 上 述 的 转化 ， 把 它们 九 
宫 格 的 左上 3x3 小 格 转化 为 图 4-14 的 “标准 型 ”: 


习 胃 面 面 国 国 国 
由 中 HH 
下 中 HEHE 
LT 


图 4-14 


不 考虑 是 否 独立 的 情况 下 ， 一 个 空 的 数 独 有 N 个 解答 ， 那 么 考虑 了 
上 述 的 等 价 关 系 之 后 ， 独 立 的 解答 数目 应 该 是 N/ (9! ) 。a 

关于 解答 的 总 数 ， 面 试 者 想 要 的 其 实 只 是 一 个 近似 的 答案 。 如 果 应 
聘 者 能 够 在 短 时 间 内 通过 分 析 ， OA 然后 推 
导出 这 个 答案 的 上 界 和 下 界 ， 就 算 很 不 错 

我 们 在 这 里 展示 一 种 用 探索 te 的 方法 估计 租 答 吉 儿 的 
路 。 数 独 的 9 个 子 块 标记 如 图 4-15 所 示 : 


为 了 方便 讨论 ， 称 B; 、B, 和 B3 组 成 一 个 “ 块 行 ”， 如 果 一 个 解 使 得 
“ 块 行 ?内 每 行 每 块 都 恰好 包含 1 到 9 这 九 个 数字 ， 则 称 该 解 为 一 个 “ 块 行 
解 "; 称 B; 、B4 和 By 组 成 一 个 “ 块 列 ”， 如 果 一 个 解 使 得 * 块 列 ” 内 每 列 每 
块 都 恰好 包含 1 到 9 这 九 个 数字 ， 则 称 该 解 为 一 个 “ 块 列 解 "如果 九 个 数 
字 在 一 个 块 内 按 如 下 方式 排列 ， 则 称 其 为 “标准 型 ”( 如 图 4-16 所 示 ) : 


图 4-16 


首先 讨论 有 多 少 组 “ 块 行 解 "。 假 设 Bj 是 “标准 型 *， 一 旦 我 们 能 得 到 
一 个 基于 Bi “标准 型 > 的 “ 块 行 解 ”， 我 们 就 能 通过 一 个 1 到 9 的 “置换 ”得 到 
另 一 个 * 块 行 解 ”〈“ 置 换 ” 是 指 每 个 数字 都 变化 为 1 到 9 中 的 一 个 数字 ， 变 
化 后 的 数字 依然 是 1 到 9， 九 个 不 重复 的 数字 ) 。 显 然 这样 的 “置换 ”共有 
9! 个 ， 所 以 如 果 基 于 Bi “标准 型 ”的 “ 块 行 解 ”X 有 N 个 ， 则 * 块 行 解 "总 共有 
91 *N 个 。 

下 面 讨论 基于 Bi “标准 型 > 的 “ 块 行 解 ” 个 数 。B,， 和 了 B; 第 一 行 的 构成 有 
两 种 可 能 性 : 由 Bj 的 第 二 行 或 第 三 行 构成 〈“ 纯 粹 型 >) ， 或 者 由 Bi 第 二 
行 第 三 行 混合 构成 (“混合 型 ”?) 。 “纯粹 型 "如 图 4-17: 
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图 4-17 


每 一 行 中 的 3 个 元 素 都 可 以 任意 交换 ， 并 且 B, 和 B, 位 置 也 可 以 交 
换 ， 所 以 共有 2* (3! ) 6。。 “混合 型 >? 如 图 4-18: 


TT Ts TT 
回国 加 区 加 加 区 四 加 
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图 4-18 
其 中 a、b、c 表 示 1、2、3 所 在 位 置 ，a 可 以 是 :、2、3 中 的 任何 一 个 
数 ， 每 一 行 中 的 3 个 元 素 都 可 以 任意 交换 ，B, 和 B, 位 置 可 以 交换 ， 此 外 
B, 和 B; 的 第 一 行 共 有 如 下 九 种 可 能 性 : 


14,5, 7 116.8,9) 
14,5,81|16,7,91 
14,5,91|116,7,81 
14,6,71|{5,8,91! 
14,6,81|{5,7,91! 
14,6,9+|15,7,8} 
{5,6,7!|{4,8,91! 
{5,6,8!|{4,7,9}! 
15,6,91|{4,7,81 


所 以 共有 3x2x9x (3! )6。 因 此 “ 块 行 解 * 共 有 9! x (2x (3! ) 6 十 
3x2x9x (3! ) 56) = 二 948109639680。 同 理 ,，“ 块 列 解 * 也 有 948109639680 
组 解 。 

满足 每 个 子 块 都 由 1 到 9 填充 的 解 共 有 N= 二 (9! ) ?。“ 块 行 解 * 有 
948109639680， 九 宫 格 内 有 三 个 * 块 行 ”， 所 以 满足 每 行 每 块 都 由 1 到 9 填 
充 的 解 共 有 M 二 9481096396803 。 满 足 块 行 限制 解 在 满足 块 限制 解 中 所 占 
的 比例 为 k=MVN。 同 理 满足 块 列 限 制 解 在 满足 块 限制 解 中 所 占 比例 也 为 
k 王 M/N。 假 设 以 上 两 个 比例 相互 独立 (事实 上 它们 并 不 完全 独立 ) ， 则 
同时 满足 块 行列 限制 解 在 满足 块 限制 解 中 所 占 比 例 约 为 kx ， 因 此 同时 满 
足 块 行 列 限 制 的 解 〈 即 空 九宫 格 的 解 ) 总 数 约 为 Nxk< 一 9481096396808 / 


(9! ) 9 一 6.6571x1021 。 该 估计 结果 与 精确 结果 6.671x10“21 相差 大 约 
0.2%0。 a 

再 考虑 第 三 个 问题 ， 如 果 现 在 有 一 个 数 独 答案 ， 我 们 怎么 记录 这 个 
答案 呢 ? 最 直接 的 方法 我 们 可 以 从 上 到 下 ， 从 左 到 右 记 录 每 一 个 数字 。 
比如 对 于 图 4-19: 


了 7|8|9| 
71819| 
了 7 89 加 回回 


数 独 可 以 记录 为 : 

12345678945678912378912345623456789156789123489123456734567 
8912678912345912345678。 

每 个 数字 用 一 个 char 来 存储 的 话 ， 需 要 空间 81byte。 如 果 用 4bit 表 示 
一 个 数字 ， 仍 需要 40.5byte。 

你 也 许 很 快 可 以 发 现 ， 我 们 只 需要 记录 数 独 的 左上 8x8 方 阵 中 的 64 个 
数字 ， 其 他 17 个 数字 必然 可 以 从 这 64 个 数字 中 推出 来 。 这 样 ， 我 们 还 使 
用 上 述 最 简单 编码 ， 则 只 需要 32byte， 记 录 数 独 为 : 

12345678456789127891234523456789567891238912345634567891678 
91234。 

肯定 还 有 很 多 可 以 进一步 压缩 空间 的 ， 例 如 每 一 个 数字 (1~9) 可 
以 用 4 个 位 就 可 以 表示 ， 又 比如 ， 如 果 12 是 相 邻 两 个 数字 ， 它 们 可 以 当 作 
整数 “12” 而 不 造成 歧义 ， 两 个 数字 才 需 要 4bit。 各 种 方法 不 一 而 足 。 那 
么 ， 最 少 需 要 多 少 空间 呢 ? 也 就 是 这 个 问题 的 下 界 是 多 少 呢 ? 


在 上 一 个 问题 中 ， 聪 明 的 读者 可 能 已 经 找到 答案 ， 不 考虑 等 价 的 情 
况 下 ， 有 6670903752021072936960 〈6.7x1021 ) 个 不 同 的 数 独 。 如 果 我 
们 使 用 k bit 空 间 ， 我 们 最 多 能 表示 2k 种 不 同 的 数 独 。 那 么 ， 我 们 需要 的 
最 少 空间 至 少 要 能 够 表示 出 所 有 这 些 数 独 : 

2k >>6.7x1021 即 k 之 73， 约 8byte 

我 们 很 好 地 利用 了 每 一 个 bit， 好 处 就 是 节省 空间 。 一 般 来 说 ， 如 果 
找到 这 样 的 编码 方案 ， 那 么 这 个 编码 译 码 算法 的 难度 会 比 上 面 的 方案 复 
杂 。 读 者 可 以 继续 寻找 更 加 节省 空间 的 编码 方案 。 
扩展 问题 


如 果 要 编码 表示 一 个 不 完全 的 数 独 (如 图 4-20 所 示 ) ， 什 么 方法 比 
较 好 ? 能 否 写 程序 实现 你 的 算法 ? 


4.10 ”数字 哑 谜 和 回 文 


人 越 大 越 聪明 还 是 越 大越 笨 ? 最 近 笔 者 看 了 一 些小 学 低 年 级 的 “ 奥 
数 ” 题 目 ， 把 脑袋 拍 痛 了 ， 还 做 不 出 来 ， 真 想 列 几 个 二 元 一 次 方程 ， 把 解 
求 出 来 一 一 不 过 小 学 低 年 级 还 没有 学 方程 ， 所 以 这 个 不 算 ， 笔 者 也 想 干 
脆 写 个 程序 ， 用 变 力 搜索 的 方法 ， 把 答案 找 出 来 算 了 ， 不 过 这 个 肯定 也 
不 是 正确 的 解法 。 看 来 我 们 “大 人 ”依赖 于 “方程 ?>、“ 程 序 ”* 太 多 了 ， 脑 子 变 
得 不 灵活 了 。 

下 面 的 问题 ， 可 以 用 小 学 三 年 级 的 方法 解决 ， 也 可 以 用 初中 列 方程 
式 的 办 法 解决 ， 还 可 以 用 大 学 的 高 级 编程 语言 解决 。 读 者 有 没有 兴趣 党 
试 和 比较 一 下 各 种 解法 ? 

1. 神奇 的 9 位 数 。 能 不 能 找 出 符合 如 下 条 件 的 9 位 数 : 

这 个 数 包括 了 1~9 这 9 个 数字 。 

这 个 9 位 数 的 前 n 位 都 能 被 n 整 除 ， 若 这 个 数 表 示 为 abcdefghi， 则 ab 可 
以 被 2 整除 ，abc 可 以 被 3 整除 .………..abcdefghi 可 以 被 9 整除 。 

2. 有 这 样 一 个 乘法 算式 : 人 过 大 佛寺 * 我 = 寺 佛 大 过 人 

这 里 面 每 一 字 都 代表 着 一 个 数字 ， 并 且 不 同 的 字 代表 的 数字 不 同 ， 
你 能 把 这 些 数 字 都 找 出 来 么 ? 

分 析 与 解法 
【问题 1 的 解法 一 】 

假设 这 个 9 位 数 是 abcdefghi， 根 据 题目 要 求 ， 每 个 字符 对 应 一 个 1~9 
之 间 的 数 。 习 惯 于 写 程序 的 人 ， 可 以 用 罕 套 的 循环 (对 a，b，...，i 进 行 
循环 ， 遍 历 各 种 可 能 的 组 合 ) 来 搜索 正确 的 解 。 

这 样 的 搜索 ， 效 率 必 然 很 低 ， 因 此 可 以 考虑 使 用 剪 枝 来 优化 性 能 。 
剪 枝 的 概念 ， 跟 走 迷 宫 避 开 死 胡同 差不多 。 如 果 把 搜索 比 作 遍 历 一 棵 
树 ， 那 么 剪 枝 就 是 将 树 中 的 一 些 不 能 到 达 解 的 枝条 “前 ” 掉 ， 以 提高 算法 
的 性 能 。 


比如 在 循环 到 b 等 于 奇数 时 ， 由 于 ab 必须 被 2 整除 ， 因 此 奇数 已 经 不 
满足 条 件 了 ， 那 就 可 以 不 用 搜索 b 等 于 奇数 的 所 有 9 位 数 ， 而 直接 对 b 加 
1。 勇 梳 后 程序 的 效率 应 该 会 有 大 幅度 地 提高 。 

【问题 1 的 解法 二 】 

我 们 还 可 以 试 一 试用 逻辑 推理 的 办 法 求解 这 个 问题 ， 假 设 每 个 字符 

目前 都 可 以 对 应 1~9 之 间 的 任何 数字 : 


3456789 
3456789 
3456789 
3456789 
3456789 
3456789 
3456789 
3456789 
3456789 


我 们 把 “整除 ”的 条 件 列 出 来 ， 见 下 : 
a 被 1 整除， 任何 数 都 能 满足 这 个 条 件 。a 可 以 是 1..9 中 的 任何 数 。 
ab 被 2 整除 
b 等 于 4 6 8 
abc 被 3 整除 

(a 十 b 十 c) 被 3 整除 
abcd 被 4 整除 
d 等 于 > 4 6 8 
cd 被 4 整除 
abcde 被 5 整除 
e 等 于 5 
abcdef 被 6 整除 
f 等 于 4 6 8 

(a 二 +b 十 c 十 d= 二 e 十 f) 被 3 整除 
abcdefg 被 7 整除 
abcd 一 efg 能 被 7 整除 (考虑 到 7 能 整除 1001) 
abcdefgh 被 8 整除 
h 等 于 4 6 8 
fgh 能 被 8 整除 
abcdefghi 被 9 整除 

(a+b 十 c 十 d 十 e 十 f 十 g 十 h 十 i) 被 9 整除 ， 肯 定 成 立 


根据 上 述 的 充 要 条 件 ， 可 以 将 各 个 字母 取 值 范围 缩小 为 : 


li hh FJ DO DDNDJ FI 2 


a L379 
b 2468 
站 1.3 79 
d 2468 
e ~ 

f 2468 
区 F379 
h 2468 
1 lI379 


我 们 还 有 下 面 的 条 件 没有 用 上 : 

(a 十 b 十 c) 被 3 整除 

cd 被 4 整除 

(d 十 e 十 f) 被 3 整除 

abcd 一 efg 能 被 7 整除 (考虑 到 7 能 整除 1001) 

fgh 能 被 8 整除 

由 于 “(d 十 e 十 f) 被 3 整除 ”"， 并 且 e 二 5， 所 以 d 十 {必须 是 3k 十 1 的 形 
式 ， 才 能 保证 整除 性 。 因 此 我 们 有 下 面 4 种 可 能 : 

(d=2, f=8) ， (d=4, f=6) ， (d=6, f=4) ， (d=8, f= 

2) 

又 由 于 cd 被 4 整除 ，cd=12，16，32，36，72，76，92，96。 我 们 得 
到 : d= 二 2 或 68， 对 应 地 ，f 等 于 8 或 4。 

看 其 他 条 件 : 


fgh 能 被 8 整除 

fgh 王 816，832，872，896，416，432，472，496 
f 二 8 时 ，d 二 2， 故 h 不 能 等 于 2， 

f 二 4 时 ，d 二 6， 故 h 不 能 等 于 6 

fgh=816, 896, 432,472 


进一步 简化 的 结果 ， 我 们 得 到 : 


a 1379 
b 48 

Cc 1379 
村 6 

e 5S 

, 。 溪 演 
2 L379 
h 62 

1 1379 


尚未 使 用 的 条 件 有 : 


“ (a 十 b 十 c) 被 3 整除 ” 
“abcd 一 efg 能 被 7 整除 ” (考虑 到 7 能 整除 1001) 
这 样 ， 我 们 可 以 推断 出 : 

cd 一 12，16，32，36，72，76，92，96 
df 一 28，64 

fgh=816, 896, 432，472 

b= 二 4 或 8 

b= 三 4, ac 三 17, 71 

b=8, ac=13, 31, 19, 91, 37, 73, 79,97 
h 一 6 或 2 

h=6, g=1o0r9, gi=93 

h=2, g=30r7, gi=31, 37, 73, 79 

bdfh 王 4286 或 8642 

bdfh 王 4286 时 ， 

ac 一 17，71 

gi 一 93 

acgi 一 1793，7193 

bdfh 王 8642 时 ， 

ac 一 13，31，19，91，37，73，79，97 
gi 王 31，37，73，79 

acgi 王 1379，3179，1937，1973，9137，9173，7931，9731 


剩 下 10 个 组 合 ， 需 要 使 用 “abcd 一 efg 能 被 7 整除 "判别 。 

最 后 得 到 的 解 是 : 381654729。 经 历 这 样 的 过 程 得 到 了 答案 ， 会 不 会 
比 写 程 序 更 快 呢 ? 
【问题 2 的 解法 】 


人 过 大 佛寺 ， 寺 佛 大 过 人 。 
真是 有 趣 的 回 文 。 我 们 尝试 用 “大 人 ”的 办 法 来 解决 。 
代码 清单 4-4 


像 这 样 变量 太 多 ， 可 能 的 解 也 不 少 的 情况 ， 用 程序 去 处 理 可 能 会 比 
较 快 。 但 是 对 于 一 些 有 提示 的 问题 ， 用 小 学 学 到 的 数学 知识 ， 加 上 简单 
的 推理 ， 就 可 以 完成 。 如 果 这 道 题 目 简化 为 : 

人 过 大 佛寺 *4 三 寺 佛 大 过 人 

也 许 你 在 纸 上 写 写 画 画 5 分 钟 就 可 以 搞定 。 

而 同样 的 5 分 钟 时 间 ， 刚 够 你 启动 电脑 ， 登 录用 户 ， 打 开 最 新 最 强 有 
力 的 编程 集成 环境 (例如 Visual Studio 2008 IDE) ， 运 用 “项 目 向 导 

(Project Wizard) ”， 回 答 了 若干 问题 后 ， 得 到 了 一 个 空 的 C++ 控制 台 项 
目 。 
我 们 太 依 赖 电 脑 ， 也 许 正 因为 我 们 懒得 思考 。 


扩展 问题 
【问题 1]】 


上 面 的 < 人 过 大 佛寺 * 我 = 寺 佛 大 过 人 ”等 式 ， 这 种 带 有 “ 回 文 ”特性 的 
对 称 的 美 ， 让 人 愉悦 。“ 回 文 * 在 中 国 传统 文学 中 有 不 少 有 趣 的 故事 。 苏 
东 坡 写 过 一 首 回 文 诗 : 

潮 随 暗 浪 雪山 倾 ， 远 浦 渔舟 钓 月 明 。 
桥 对 寺 门 松 径 小 ， 槛 当 泉 眼 石 波 清 。 
运 运 绿 树 江天 晓 ， 需 需 红 霞 晚 日 晴 。 
遥望 四 边 云 接 水 ， 怕 峰 千 点 数 鸥 轻 。 

这 首 诗 ， 顺 着 读 下 来 ， 读 者 仿佛 看 到 了 从 月 夜景 色 到 江天 破晓 的 画 
面 。 而 反 过 来 读 ， 就 变 成 了 : 

轻 鸥 数 点 千 峰 条， 水 接 云 边 四 望 壳 。 

晴 日 晚霞 红 露 震 ， 晓 天 江 树 绿 巡 过 。 

清 波 石 眼 泉 当 槛 ， 小 径 松 门 寺 对 桥 。 

明月 钓 舟 渔 浦 远 ， 倾 山 雪 浪 暗 随 潮 。 
仿佛 是 一 幅 从 黎明 晓 日 ， 到 渔舟 唱 晚 的 画卷 。 

回 文 修辞 在 英语 中 也 有 ， 比 如 , “Able was I ere I saw Elba”， 这 和 句 话 
形式 上 对 称 了 ， 但 意境 上 似乎 不 能 和 上 面 提 到 的 中 文 回 文 同日 而 语 。 

与 回 文 诗 对 应 的 回 文 数 ， 也 有 着 严格 的 对 称 美 ， 不 论 是 从 左 向 右 顺 
读 ， 还 是 从 右 向 左 倒 读 ， 结 果 都 是 一 样 的 ， 例 如 : 323、4554 都 是 回 文 
数 。 

在 两 位 数 中 ， 回 文 数 有 11，22，33，...，99; 在 三 位 数 中 ， 有 111， 
121，131，...，222，...。 那 么 ，N 位 回 文 数 的 个 数 总 共有 多 少 呢 ? 数字 
回 文 难 言 意境 ， 但 是 也 许可 以 在 数量 上 取胜 ? 8 
【问题 2】 

这 本 书 的 作者 全 部 是 男士 ， 但 事实 上 微软 公司 里 有 不 少 优秀 的 女 员 
工 和 女 实 习 生 。 她 们 不 仅 是 “半边 天 ”， 而 且 往 往 发 挥 着 “一 个 顶 俩 ”的 作 
用 。 下 面 一 道 题目 就 是 作者 们 献 给 女 员 工 的 : 

(he) “一 she 


“他 ”的 平方 等 于 “她 ”， 读 者 们 能 把 h、e、s， 代 表 的 数字 找 出 来 么 ? 

问题 2 的 推广 : 大 家 一 般 都 “假定 ”(assume) 我 们 说 的 数字 是 十 进 
制 ， 很 多 创意 都 被 一 些 “ 假 定 ” 给 限制 住 了 。 如 果 不 是 十 进 制 ， 那 么 我 们 
上 面 的 各 个 等 式 还 有 解 么 ? 试 试看 ， 也 许 解法 更 精彩 。 


4.11 ” 挖 雷 游戏 的 概率 


让 我 们 再 回 到 挖 雷 (Minesweeper) 游戏 ， 游 戏 开 始 时 用 户 的 第 一 
点 击 点 并 不 会 碰 到 任何 地 雷 ， 程 序 在 此 之 后 才 开 始 随 机 放置 地 雷 。 = 
次 点 击 的 时 候 就 要 小 心 了 ， 可 能 一 下 就 “ 遇 雷 身亡 ”了 。 

我 们 看 一 个 例子 ， 在 16x16 的 地 雷 阵 中 ， 有 40 个 地 雷 。 用 户 点 击 了 两 
下 ， 出 现 如 图 4-21 的 局 面 : 


图 4-21 


问题 1: 当 这 个 游戏 有 40 个 地 雷 没有 被 发 现 的 时 候 ，A、B、C 三 个 
方块 有 地 雷 的 概率 (P (A) ，P (B) ，P (C) ) 各 是 多 少 ? 

问题 2: 这 个 游戏 局 面 一 共有 16x16 王 256 个 方块 ，P (A) 、P 
(B) 、P (C) 的 相互 大 小 关系 和 当前 局 面 中 地 雷 的 总 数 有 什么 联系 
么 ? 比如 ， 当 地 雷 总 数 从 10 个 逐渐 变化 到 240 个 , P (A) 、P (B) 和 P 
(C) 的 三 条 曲线 是 如 何 变化 的 2? 它们 会 不 会 相交 ? 


注释 


QD 微软 的 员工 只 有 在 工作 一 年 以 上 ， 并 且 通 过 严格 的 面试 者 培训 之 后 ， 才 允许 参加 面试 
工作 。 

包 ”金刚 的 口头 禅 是 一 一 我 是 金刚 ， 我 怕 谁 ?大 家 在 旅途 中 可 能 看 见 过 类 似 的 事 儿 。 

”如 果 考 虑 等 价 关 系 翻 转 人 旋转 呢 ? 这 是 一 个 有 一 定 挑战 性 的 问题 ， 留 给 读者 思考 。 

”有 应 聘 者 一 开始 就 断言 数 独 的 总 数 不 会 超过 9 个 ， 并 花 了 很 多 时 间 证 明 这 一 点 ， 不 过 没 
有 证 明 出 来 。 

”参考 文献 : http://www.afjarvis.staff.shef.ac.uk/sudoku/felgenhauer_jarvis_spec1.pdf。 

@ ”前 国立 清华 大 学 校长 刘 炯 朗 教授 曾 于 2007 年 4 月 份 在 微软 亚洲 研究 院 做 了 一 次 精彩 的 演 
讲 一 一 “ 数 与 诗 的 后 现代 对 话 ”， 其 中 提 到 回 文 诗 及 各 种 数 与 诗 的 有 趣 故事 ， 详 情 参 见 
www.msra.cn 网 站 。 

@， 面试 者 经 常 磁 到 应 聘 者 号 称 自己 精通 Matlab ， 这 道 题目 可 以 让 Matlab 高 手 显 示 一 下 自己 
的 风采 。 
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邹 欣 


现任 微软 亚洲 研究 院 技术 创新 组 研发 主管 。 他 从 1996 年 至 2003 年 
在 微软 Outlook 产 品 团队 从 事 开 发 工作 ，2003 年 至 2005 年 ， 在 微软 Visual 
Studio Team System 产品 团队 负责 软件 质量 管理 工具 的 开发 。 加 入 微软 
前 ， 邻 欣 从 事 过 商用 Unix 系 统 、GPS/GIS 软 件 开 发 以 及 软件 测试 工作 。 
他 在 2007 年 出 版 了 《 移 山 之 道 一 -VSTS 软 件 开 发 指南 》 一 书 。 

于 1991 年 获 北 京 大 学 计算 机 软件 专业 学 士 学 位 。1996 年 获 美国 
Wayne State University ( 韦 恩 州立 大 学 ) 计算 机 软件 专业 硕士 学 位 。 


春节 长 假 的 最 后 一 天 晚上 ， 我 把 最 后 一 批 修改 过 的 稿子 通过 电子 
邮件 发 给 了 编辑 们 ， 当 时 觉得 心情 非常 轻松 一 一 终于 RTM (Release To 
Manufacturer) 了 。 

除了 对 其 他 作者 、 审 阅 者 、 编 辑 们 的 再 次 感谢 ， 我 不 想 多 说 什 
么 ， 倒 是 想 贴 一 幅 图 展示 这 一 本 书 的 创作 过 程 ， 图 中 的 两 条 曲线 ， 一 


条 是 我 和 其 他 作者 交流 的 E-mail 数 量 ; 另 一 条 则 是 我 和 编辑 们 就 这 本 书 
交流 的 E-mail 通 信 数 量 。 


还 有 一 条 曲线 是 我 们 在 Team Foundation Server 上 修改 的 次 数 ， 但 是 线 太 多 了 觉得 不 美 。 这 
两 条 足以 说 明 问 题 。 

谚语 说 ， 一 幅 图 胜 过 一 千 句 话 ， 不 同 的 人 有 不 同 的 一 千 句 话 来 解 
读 这 些 曲线 。 我 只 想 说 明 一 下 为 什么 曲线 在 2007 年 10 月 左右 会 有 大 幅 
度 的 下 降 。 一 个 原因 是 ， 那 时 候 ， 我 们 写 了 不 少 题目 ， 自 己 觉得 该 写 
的 都 号 了 ， 但 是 题目 中 很 难看 出 来 < 美 ”， 大 家 得 喘 口 气 ， 我 也 不 能 继 
续 发 邮件 去 “drive” 其 他 人 。 另 一 个 原因 是 ， 编 辑 们 也 看 出 来 书稿 的 质 
量 并 不 像 原来 想象 的 那么 好 ， 有 人 建议 干脆 去 掉 “ 美 ?， 封 面 直 书 “面试 
心得 ”或 “我 是 如 何 打 入 微软 的 ” 即 可 一 一 市 面 上 质量 一 般 的 面试 书 也 卖 
得 很 好 ， 我 们 不 如 也 乘势 赚 一 笔算 了 。 我 们 原 定 11 月 份 出 版 ， 如 果 这 
时 ， 大 家 打 不 住 ， 稀 里 糊涂 出 了 书 ， 我 想 这 一 定 不 是 一 件 美 事 。 这 的 
确 是 项 目 比 较 黑暗 的 时 期 ， 后 来 责任 编辑 之 一 也 离开 了 。 

后 来 呢 ? 从 图 上 可 以 看 出 来 ， 我 们 经 过 10 月 份 的 喘息 后 ， 增 加 了 
人 手 ， 奔 向 了 一 个 新 的 里 程 碑 (milestone) ， 大 家 针对 一 些 难 题 紧 咬 
不 放 ， 从 办 公 果 讨论 到 餐 果 上 ; 砍 掉 一 些 不 够 “ 美 " 的 题目 ; 请 了 三 位 
同事 给 我 们 专门 挑 错 ; 我 的 “drive” 也 升级 到 “hard drive” 一 一 以 请 吃 午 
饭 为 名 ， 和 每 一 位 作者 逐 句 复审 ， 如 果 E-mail 没 有 回复 ， 就 打 电 话 .….…. 


当年 背诵 的 古文 里 有 “ 张 驻 一 跃 ， 不 能 十 步 ， 轰 马 十 驾 ， 功 在 不 
舍 ” 这 样 的 话 ， 也 许 开 始 大 家 都 自以为是 异 戏 ， 蹦 鸣 蹦 足 ， 搜 罗 一 些 题 
目 ， 辅 以 伪 代 码 ， 并 掺 杂 若 干 幽默 ， 就 大 功 告 成 。 没 想到 后 来 才 发 现 
我 们 都 是 一 群 驾 马 ， 一 匹 马 蹦 趾 不 出 什么 名 堂 ， 要 团结 协作 ， 长 途 路 
涉 ， 中 途 还 要 歇息 几 次 ， 方 能 到 达 目 的 地 ， 关 键 在 于 “ 功 在 不 舍 " 这 一 
句 话 。 

软件 开发 有 一 个 阶段 很 少 有 人 提 及 ， 叫 “death march”。 就 像 军 队 攻 
城 ， 一 队 队 士兵 冒 着 炮火 出 击 ， 伤 亡 无 数 ， 但 是 敌人 还 是 那么 强大 ， 
火力 看 似 依旧 那么 猛 ， 但 是 指挥 官 还 是 下 令 新 的 士兵 继续 出 发 ， 开 始 
新 的 march。 在 软件 开发 中 ， 这 个 阶段 就 是 你 每 天 都 加 班 写 程序 ， 改 
bug， 但 是 bug 不 见 少 ， 第 二 天 ， 第 三 天 ， 下 一 周 ， 下 一 个 月 .…… 还 是 
这 样 。 经 过 “death march”， 最 后 ， 有 些 军 队 破 城 而 入 ; 最后， 有些 软 件 


成 功 发布 ; 最 后 ， 这 书 到 底 这 么 样 ， 还 得 读者 说 了 算 一 一 我 相信 和 群 
众 。 
刘 铁 锋 


湖北 仙桃 人 。2006 年 毕业 于 华中 科技 大 学 机 械 科学 学 院 ， 获 工业 
工程 硕士 学 位 。 现 就 职 于 微软 亚洲 研究 院 搜 索 技 术 中 心 ， 从 事 搜 索引 
擎 软件 开发 工作 。 他 醉心 技术 ， 以 抽 丝 剥 草 、 揪 出 问题 为 平生 快 事 。 
工作 之 余 ， 以 读书 自 娱 为 乐 ， 然 杂 而 不 精 。 相 信 天 道 酬 勤 ， 答 乌 终 能 
先 飞 。 


实在 很 难 相 信 ， 我 这 个 不 容易 坚持 持续 做 完 且 做 好 一 件 事 情 的 
人 ， 竟 然 坚 持 花 了 近 一 年 的 时 间 和 大 家 一 起 创作 出 了 一 本 书 。 

历经 重重 修改 、 审 阅 ， 这 本 《编程 之 美 一 一 微软 技术 面试 心得 》 
的 修改 已 经 接近 了 尾声 。 

这 一 年 的 时 间 ， 也 正 是 我 到 微软 工作 的 第 一 年 ， 刚 刚 经 历 了 从 一 
个 求职 者 、 软 件 工程 师 到 面试 者 的 角色 转变 。 而 这 个 过 程 ， 也 伴随 了 
整 本 书 的 出 版 过 程 。 

作为 一 个 曾经 的 求职 者 ， 当 时 自己 能 够 做 的 ， 就 是 搜集 和 整理 能 
够 在 网 络 上 搜刮 到 的 所 有 题目 。 算 法 题 、 智 力 题 以 及 各 种 面 经 。 把 各 
种 题目 做 到 让 自己 条 件 反 射 为 止 。 而 这 本 书 的 创作 过 程 之 初 ， 也 同样 
如 此 。 把 自己 经 历 过 的 、 网 络 上 看 到 的 、 同 事 们 讨论 过 的 题目 统统 都 
拿 过 来 ， 进 行 分 类 和 研究 ， 作 为 撰写 书籍 的 原材料 。 虽 然 美中不足 的 
是 有 些 题目 的 分 类 了 略微 牵强 ， 但 是 ， 从 分 类 的 结果 来 看 ， 也 基本 上 代 
表 了 微软 面试 会 经 常 探 测 面试 者 的 几 个 方面 : Problem Solving，Coding 
Skills, Algorithm Analysis Skills。 

而 作为 一 个 软件 工程 师 ， 编 写 程序 是 本 职工 作 。 每 个 新 人 必 受 的 
打击 ， 就 是 Code Review。 在 这 个 Review 的 过 程 中 ， 你 能 够 体会 到 多 年 
的 编程 经 验 表现 在 什么 地 方 。 你 会 发 现 Review 之 后 ， 就 算是 短 短 的 几 
十 行 代码 可 能 会 一 行 都 不 能 用 。 的 确 如 此 ， 当 你 的 产品 发 布 出 去 之 
后 ， 你 希望 它 能 够 稳定 使 用 ， 不 出 任何 问题 (当然 ， 这 是 理想 情 
况 ) 。 你 会 发 现 需 要 考虑 的 ， 实 在 有 太 多 的 问题 。 

在 完成 了 第 一 个 项 目 之 后 ， 回 过 头 来 再 看 看 同事 们 的 解答 ， 以 及 
中 间 附 上 的 代码 ， 就 能 够 清楚 地 从 自己 写 的 代码 中 看 出 编程 的 功力 。 
自己 工程 的 实践 、 同 事 们 在 Code Review 过 程 中 对 代码 提出 的 种 种 质 
疑 ， 以 及 处 理 种 种 程序 在 实际 运行 中 碰 到 的 问题 ， 也 为 我 积累 了 更 多 
的 思考 ， 并 且 会 更 加 了 解 应 该 通过 题目 给 读者 传递 怎样 的 信息 。 

而 当 自 己 开始 面试 求职 者 的 时 候 ， 还 是 有 更 多 的 收获 。 在 面试 的 
高 峰 期 ， 一 周 之 内 大 概 会 有 3 个 电话 面试 ，3 个 On Site 面 试 。 在 HR 统计 
的 结果 中 ， 我 手 上 的 通过 率 不 到 20%。 在 面试 的 过 程 中 ， 我 也 会 直接 
拿 书稿 中 的 题目 来 挑战 面试 者 ， 希 望 能 够 看 到 有 精彩 的 解法 。 同 时 ， 


也 是 对 题目 的 一 个 有 益 的 补充 。 不 仅 如 此 ， 怎 样 的 面试 题目 才能 挑选 
出 一 个 合格 的 软件 工程 师 ? 反 过 来 ， 换 到 读者 的 角度 ， 这 个 间 题 应 该 
是 ,微软 到 底 会 出 怎样 的 题目 来 甄别 求职 者 ? 

以 我 个 人 的 经 验 来 看 ， 分 析 问 题 的 方法 更 加 重要 。 这 也 是 在 书 中 
努力 想 传达 给 读者 的 重要 信息 。 

从 分 析 的 套路 上 来 说 ， 作 者 们 也 都 是 通过 先 提供 一 个 简单 的 方 
法 ， 然 后 试图 找 出 一 个 更 好 的 办 法 ， 这 样 不 断 地 挑战 自己 的 智力 来 分 
析 题 目 。 

而 这 个 过 程 ， 也 正 是 面试 者 和 求职 者 的 互动 过 程 。 这 种 套路 也 是 
通过 解 每 一 道 题目 想 教会 读者 如 何 分 析 问 题 的 一 个 套路 。 

正 所 谓 “ 无 招 胜 有 招 " “万 变 不 离 其 未 ”。 题 目 只 是 一 个 表象 ， 面 试 
的 过 程 中 希望 看 到 的 是 面试 者 真正 的 实力 。 

所 以 ， 也 真心 盼望 读者 能 够 在 阅读 本 书 的 过 程 中 ， 体 会 到 面试 者 
到 底 想 通过 题目 考察 出 哪些 方面 的 能 力 。 

在 本 书 的 创作 过 程 中 ,我 从 邹 欣 老师 身上 学 到 了 不 少 东 西 。 他 也 
让 我 明白 了 一 个 道理 : 不 怕 慢 ， 就 怕 站 。 方 向 确定 后 ， 只 要 天 天 有 行 
动 ， 最 终 一 定 能 够 有 结果 。 计 划一 定 是 要 以 执行 为 依托 的 。 

限于 作者 们 的 水 平 ， 每 一 道 题目 的 解答 绝 非 尽善尽美 ， 甚 至 还 会 
有 并 在 的 bug。 也 切 盼 能 够 得 到 读者 的 反馈 。 


莫 瑜 


2006 年 毕业 于 中 山大 学 计算 机 科学 系 ， 获 硕士 学 位 。 他 热爱 编 
程 ， 曾 多 次 参加 ACM 程 序 比 赛 ， 现 为 微软 亚洲 研究 院 搜 索 技 术 中 心软 
件 开 发 工程 师 。 


转眼 一 年 过 去 了 ，《 编 程 之 美 
了 。 

回想 大 家 一 起 合作 的 日 子 ， 我 自己 学 到 了 很 多 东西 。 当 初 ， 看 到 
邬 欣 老师 的 倡议 ， 觉 得 创作 这 样 的 一 本 书 还 是 挺 有 意义 的 ， 并 且 抱 着 
跟 其 他 优秀 同事 学 习 的 想法 ， 有 季 成 为 了 一 位 “作者 ”。 其 实 ， 我 觉得 
把 我 的 名 字 挂 在 书 上 ， 有 点 性 位 素 餐 的 感觉 。 在 编写 《编程 之 美 
微软 技术 面试 心得 》 的 过 程 中 ， 我 贡献 甚 微 。 相 反 ， 伴 随 着 我 从 学 生 
到 软件 开发 工程 师 的 角色 转变 ， 其 他 作者 无 形 中 给 我 上 了 一 堂 课 。 

最 开始 ， 我 们 收集 题目 ， 大 家 一 起 讨论 改进 各 个 问题 的 解法 ， 然 
后 去 掉 一 些 面试 时 并 不 合适 的 问题 ， 手 头 也 有 了 不 少 草 稿 。 我 一 度 认 
为 ， 一切 进 展 得 都 很 “顺利 ”， 应 该 很 快 就 “大 功 告 成 * 了 。 但 很 快 地 ， 我 
发 现 这 些 草 稿 离 “ 书 ” 的 要 求 还 很 远 。 后 来 ， 事实 也 证 明 后 面 的 工作 才 
是 最 重要 的 。 其 实 我 是 一 个 不 太 会 表达 的 人 ， 写 作文 对 我 来 说 从 来 都 
是 一 件 头痛 的 事情 ( 写 这 篇 文章 的 时 候 也 不 例外 ) 。 刚 开始 ， 我 总 是 
三 言 两 语 就 写 完 自 己 的 想法 ， 有 时 甚至 是 不 成 熟 的 想法 ， 然 后 就 以 为 
差不多 了 。 相 反 ， 其 他 同事 在 这 方面 就 做 得 很 好 ， 更 懂得 如 何 去 把 一 
个 问题 描述 清楚 ， 写 得 有 条 理 、 通 俗 易 懂 。 

如 何 进 行 版 本 维护 ? 如 何 保 证 写作 风格 尽 可 能 地 统一 ? 如 何 把 一 
件 看 似 简 单 的 事情 做 好 ? 这 些 问 题 ， 我 压根 就 没有 考虑 过 。 

类 似 地 ， 在 软件 开发 方面 ， 可 能 也 有 不 少 跟 我 一 样 的 微软 新 员 
工 ， 觉 得 自己 大 大 小 小 的 程序 也 写 了 一 些 ， 软 件 开发 也 就 是 写 写 几 行 
程序 ， 没 太 大 问题 。 以 前 自己 写 程序 的 时 候 ， 可 以 随意 地 按 自 己 喜 欢 
的 方式 做 ， 不 会 考虑 变量 名 的 命名 ， 也 不 用 考虑 水 数 的 接口 ， 反 正 整 
个 程序 都 在 自己 心里 。 这 就 有 点 像 是 我 们 自己 随意 记录 的 草稿 和 等 
记 ， 也 只 是 给 自己 看 ， 不 考虑 会 有 其 他 人 阅读 。 因 为 这 草稿 和 笔记 别 
人 根本 看 不 明日 。 这 样 想 来 ， 做 软件 开发 和 写 一 本 书 还 真是 有 很 多 相 
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似 之 处 。 写 书 ， 希 望 相 关 的 读者 能 读 懂 ; 而 写 软件 也 希望 能 让 用 户 用 
的 明白 。 一 个 团队 合作 开发 软件 ， 就 像 一 伙 人 一 起 写 一 本 书 。 因 为 你 
的 代码 需要 维护 ， 因 为 多 人 合作 开发 ， 而 不 是 “ 单 兵 作战 ?， 如 何 设计 
和 定义 模块 接口 ， 管 理 维护 代码 ? 我 们 再 也 难以 做 到 整个 程序 都 在 自 
己 的 掌控 之 中 。 还 有 ， 如 何 写 可 靠 安 全 的 代码 呢 ..…... 这 些 是 软件 开发 
中 经 常 全 到 的 问题 ， 也 是 面试 时 应 聘 者 容易 忽略 的 问题 。 

当年 ， 我 被 微软 面试 的 时 候 ， 曾 碰 到 一 个 问题 : 完成 下 面 归并 排 
序 函 数 ， 将 有 序数 组 arrX 和 arrY 归 并 排序 的 结果 存 到 arrZ 数 组 中 。 

Bool MergeSort(int* arrX, int nX, int* arrY, int nY, int* arrZ, int nZ) 

在 面试 房间 的 白板 上 ， 我 很 快 就 把 整个 程序 写 完 了 ， 然 后 开始 想 
后 面 有 些 什么 难题 呢 ? 但 ， 面 试 者 简单 的 几 名 话 就 让 我 无 言 以 对 
“你 有 没有 考虑 数组 指针 arrX 和 arrY 是 否 为 空 ?它们 的 分 配 空间 是 否 5 
能 重 亚 ? ” 那 时 ， 我 还 认为 这 些 太 苛 刘 了 吧 。 

但 在 实际 软件 开发 的 时 候 ， 若 下 忽 了 这 些 细节 ， 可 能 会 带 来 潜在 
的 bug。 以 前 ， 我 觉得 一 个 出 错 的 可 能 性 为 百 万 分 之 一 的 程序 尚 可 忍 
受 ， 但 在 类 似 搜索 引擎 这 种 每 天 被 大 量 用 户 使 用 的 软件 系统 上 ， 这 样 
的 错误 却 是 无 法 容忍 的 。 

对 我 个 人 来 说 ， 参 与 创作 《编程 之 美 一 一 微软 技术 面试 心得 》， 
给 了 我 与 其 他 同事 合作 及 一 起 学 习 的 机 会 。 虽 然 读 者 们 不 能 像 我 一 样 
杀 历 写 书 过 程 中 受到 的 启发 ， 但 相信 读者 们 也 可 以 从 书 中 或 难 或 易 的 
问题 里 得 到 一 些 启 发 。 一 本 书 的 出 版 ， 就 像 一 个 新 的 软件 系统 的 发 布 
和 上 线 。 出 版 (发布) 前 的 心情 总 是 很 复杂 ， 既 兴奋 却 多 少 也 有 些 担 
心 。 兴 奋 ， 是 因为 我 们 的 努力 可 能 会 带 给 读者 帮助 ， 希 望 大 家 能 从 中 
得 到 一 些 启发 ， 即 使 在 面试 的 时 候 并 不 一 定 会 磁 到 这 些 具 体 的 问题 ，; 
担心 ， 则 当然 是 害怕 由 于 我 们 的 疏 急 ， 时 间 和 水 平 的 有 限 而 存在 潜在 
的 bug， 和 希望 读者 们 多 指正 。 


李 东 


重庆 大 学 软件 学 院 研究 生 ， 微 软 亚洲 研究 院 实习 生 。 

他 来 目 关东 屏 南 县 路 下 乡 方圆 村 ， 喜 爱 足 球 ， 认 为 足球 与 编程 都 
是 时 有 激情 的 。 他 在 写 书 之 余 ， 参 加 了 七 个 公司 的 面试 ， 有 五 个 公司 
向 他 发 出 了 邀请 ， 目 前 他 正在 考虑 中 。 


2008 年 春 ， 我 们 创作 的 《编程 之 美 一 一 微软 技术 面试 心得 》 即 将 
出 版 了 ! 

回想 《编程 之 美 一 一 微软 技术 面试 心得 》 的 诞生 和 成 长 ， 感 慨 颇 
多 。 应 该 是 在 2007 年 4 月 的 某 一 天 ， 与 分 老师 一 起 吃饭 的 时 候 ， 就 听 邹 
老师 说 想 编 写 一 本 关于 编程 算法 方面 的 书 。 其 实在 此 之 前 ， 邹 老师 隔 
三 差 五 就 会 发 些 算法 题 Challenge 我 们 全 体 TTG 的 Intern， 大 家 的 热情 也 
很 高 涨 ， 其 中 有 道 控 制 CPU 占 用 率 曲 线 的 题 ， 据 说 分 老师 用 此 题 “ 干 掉 
了 "不 少 人 。 有 实习 生 经 过 努力 ， 用 几 行 程序 就 画 出 了 很 平滑 、 很 美的 
正弦 曲线 。 


几 天 后 ， 邹 老师 发 信 问 我 和 张 晓 是 否 愿 意 加 入 创作 小 组 ， 我 大 
喜 ， 生 平 第 一 次 能 搭 上 写 书 的 边 ， 而 且 秋 季 就 要 找 工 作 了 ， 应 该 很 能 
锻炼 自己 ， 于 是 欣然 答应 。 小 组 很 快 成 立 起 来 了 ， 铁 锋 负责 收集 题 
目 ， 莫 瑜 负责 解 题 ， 张 晓 、 陈 远 和 我 负责 Review 莫 瑜 解 的 题 。 邹 老师 
则 负责 统筹 全 局 。 后 来 梁 举 、 胡 相继 加 入 创作 小 组 ， 随 着 书稿 越 来 越 
厚 ， 参 与 的 人 也 越 来 越 多 ， 包 括 研 究 院 的 众多 研究 员 和 博文 视点 编辑 
部 的 众 位 老师 。 这 里 不 再 一 一 列 出 ， 详 见 此 书 致 谢 @ 

以 前 总 觉得 只 要 是 个 人 他 就 能 够 写 书 ， 但 从 来 没有 想到 过 创作 一 
本 书 这 么 难 。 众 位 作者 绝 不 想 让 这 本 书 成 为 一 本 习题 集 ， 我 们 尽 自 己 
最 大 的 努力 ， 去 努力 呈现 编程 和 算法 世界 中 的 美 。 在 创作 过 程 中 ， 我 
们 采用 微软 敏捷 开发 和 TEFS (Team Foundation Server) 来 管理 文档 和 进 
度 。 每 一 个 题 都 作为 一 个 独立 的 工作 项 (Task) 存在 。 打 开 每 一 个 工作 
项 ， 你 都 会 发 现 ， 其 中 都 有 10 多 个 的 文档 ， 每 一 个 文档 都 是 一 次 更 新 
后 的 版 本 ， 也 就 是 说 ， 每 一 个 题 都 经 过 众多 作者 的 10 多 次 迭代 编写 而 
来 。 而 高 霖 作为 本 书 的 装帧 设计 师 (Designer) ， 为 本 书 设计 了 全 套 的 
封面 、 封 底 和 众多 插图 ， 而 这 些 男 也 都 是 在 被 大 家 “枪毙 ”> 了 N 次 〈N> 
二 10) 之 后 才 最 终 定稿 。 该 书 凝聚 了 大 家 多 少 的 心血 ， 由 此 可 见 一 
斑 。 在 编写 的 后 期 ， 邹 老师 和 铁 锋 等 人 继续 带领 着 我 们 对 文稿 进行 字 
贡 句 酌 的 修改 ， 不 轻易 放 过 任何 一 个 有 瑕 钼 的 地 方 。 

我 有 笠 成 为 本 书 的 创作 者 之 一 ， 其 实 我 也 是 本 书 的 受益 者 之 一 。 
我 今年 研 三 ， 正 如 前 面 所 提 ， 投 入 了 2007 年 秋季 的 招聘 大 军 ， 正 是 编 
写 《 编 程 之 美 一 一 微软 技术 面试 心得 》， 为 我 在 激烈 的 竞争 中 取胜 增 
添 了 很 重要 的 筹码 ， 今 年 7 月 我 将 前 往 微 软 上 海 Windows Live Mobile 就 
只 ， 担 任 的 职位 是 SDET。 本 书 的 作者 中 ， 不 乏 像 莫 瑜 这 样 的 ACM 大 
牛 ， 我 常常 直接 杀 到 他 的 位 置 上 与 他 讨论 问题 ， 正 是 由 于 有 着 众多 作 
者 激烈 的 讨论 ， 才 常常 有 令 人 拍案 的 想法 进出 ， 而 我 在 这 一 过 程 中 也 
学 习 到 了 很 多 知识 。 在 去 年 秋季 的 应 聘 过 程 中 ， 我 常常 会 被 问 到 《 编 
程 之 美 一 一 微软 技术 面试 心得 》 中 的 题目 ， 可 能 有 人 说 ， 那 就 是 你 运 
气 好 了 ， 但 我 在 这 里 绝 不 是 说 大 家 将 看 到 一 本 面试 秘籍 或 者 说 大 家 把 
这 里 面 的 题 都 背 下 来 就 万 事 大 吉 了 。 其 实 即 使 我 在 被 问 到 书 中 的 题目 


时 ， 都 会 很 坦诚 地 告诉 面试 官 ， 这 个 题 我 做 过 。 我 想 说 的 是 ，《 编 程 
之 美 一 一 微软 技术 面试 心得 》 和 希望 呈现 给 读者 的 是 解 题 的 思路 和 过 
程 ， 也 就 是 说 ， 当 你 遇 到 一 个 问题 时 ， 该 如 何 去 分 析 和 解决 问题 ， 这 
才 是 本 书 努 力 想 与 读者 分 享 的 地 方 。 也 只 有 懂得 了 如 何 分 析 问 题 和 如 
何 解决 问题 ， 才 能 够 真正 体会 到 编程 和 算法 的 美 。 希 望 读者 在 阅读 本 
书 的 时 候 ， 能 够 抱 着 一 颗 寻 找 美 的 心 ， 先 自己 独立 思考 每 一 个 题目 的 
解法 ， 再 阅读 书 中 的 思路 和 解法 ， 比 较 上 自己 的 思路 和 书 中 思路 的 差 
异 ， 努 力 从 中 掌握 分 析 问 题 和 解决 问题 的 方法 。 最 后 ， 我 想 告诉 大 
家 ， 近 期 ， 微 软 亚洲 研究 院 将 每 周 在 官方 网 站 上 连载 《编程 之 美 一 一 
微软 技术 面试 心得 》 中 的 题目 ， 欢 迎 大 家 到 网 站 上 参与 题目 的 讨论 和 
解答 ， 也 希望 《编程 之 美 一 一 微软 技术 面试 心得 》 能 够 将 美的 享受 囊 
给 每 一 位 读者 。 谢 谢 。 


张 晓 


清华 大 学 高 等 研究 所 博士 生 ， 微 软 亚 洲 研 究 院 实习 生 。 他 在 天 津 
度 过 了 18 年 快乐 的 时 光 ， 又 在 清华 电子 系 学 习 了 4 年 。 本 科 期 间 ， 参 加 
过 不 少 科技 活动 。 虽 然 没 有 多 少 拿 的 出 手 的 成 绩 ， 但 一 直 在 努力 。 他 
在 一 群 喜 欢 计算 机 、 热 爱 编程 的 同学 们 和 老师 的 一 陶 下 ， 对 计算 机 技 
术 产 生 了 浓厚 的 兴趣 ， 并 在 本 科 毕 业 时 决定 来 到 微软 亚洲 研究 院 实 


习 ， 投 身 于 软件 行业 。 张 晓 在 工作 之 余 ， 癌 欢 阅 读 高 科技 企业 的 传 
记 ， 药 想 以 技术 服务 社会 ， 直 高 质量 、 个 性 化 的 信息 触手 可 及 。 


《编程 之 美 一 一 微软 技术 面试 心得 》 创 作 组 的 正式 成 立 是 2007 年 6 
月 初 ， 但 其 实 我 和 《编程 之 美 一 一 微软 技术 面试 心得 》 的 缘分 在 4 月 份 
就 已 经 开始 了 。 


那 时 我 刚 到 IEG 组 实习 ， 有 一 天 收 到 了 邹 老 师 的 邮件 ， 说 是 为 了 提 
高 了 下 G 实 习 生 的 编程 能 力 ， 让 我 们 解 一 个 编程 的 趣味 题 ， 解 得 好 有 奖 
励 。 从 这 天 起 ， 邹 老师 就 经 常 给 我 们 发 类 似 的 编程 题目 。 这 些 题 目 有 
些 本 身 就 很 有 意思 ， 比 如 与 下 棋 、 游 戏 有 关 的 。 有 些 问 题 还 包括 很 多 
扩展 问题 ， 由 浅 入 深 ， 越 到 后 面 问题 越 有 挑战 性 。 在 那 段 时 间 里 如 果 
你 看 到 希 格 玛 大 厦 四 层 西 南 区 有 几 个 人 围 着 几 张 纸 坐 在 一 起 作 冥 思 苦 
想 状 ， 那 多 半 就 是 在 想 这 些 题 的 解法 。 我 也 经 常会 在 宿舍 * 卧 谈 ? 时 跟 
室友 聊 这 些 题目 ， 室 友 们 也 很 感 兴趣 。 每 次 和 公司 同事 或 室友 讨论 ， 
总 能 让 我 领悟 一 些 新 的 东西 。 这 些 题目 就 是 《编程 之 美 一 一 微软 技术 
面试 心得 》 的 前 身 。 

到 了 6 月 初 的 时 候 ，《 编 程 之 美 一 一 微软 技术 面试 心得 》 创 作 组 就 
正式 成 立 了 。 我 被 分 配 的 任务 是 理解 牛人 给 出 的 解法 ， 并 用 易于 理解 
的 语言 叙述 出 来 。 这 个 任务 让 我 有 两 方面 的 收获 ， 一 方面 书 中 的 问题 
很 多 都 有 一 定 的 难度 ， 牛 人 给 出 的 解法 虽然 简短 但 并 不 很 直观 ， 但 一 
旦 理解 这 些 算法 的 内 涵 就 往往 能 够 让 我 对 编程 有 新 的 认识 。 另 一 方 
面 ， 用 读者 易于 理解 的 语言 描述 技术 问题 也 不 容易 ， 这 也 锻炼 了 我 的 
写作 能 力 。 

为 了 管理 写作 的 进度 和 保存 历史 数据 ， 我 们 还 在 邹 老师 的 主持 之 
下 设立 了 有 “微软 特色 ”的 沟通 机 制 。 那 就 是 在 Visual Studio Team Suite 

(VSTS) 上 把 所 有 计划 要 写 的 题目 做 成 Work Item， 给 每 个 Work Item 
设置 3 种 状态 : Active、Peer Review 和 Editor Review。 每 一 道 题 最 开始 
都 处 于 Active 状 态 ， 在 经 过 答案 的 产生 和 润色 之 后 进入 Peer Review 阶 
段 。 在 这 个 阶段 ， 会 有 其 他 作者 来 检查 这 道 题目 的 解答 中 是 否 存在 漏 
洞 。 如 果 该 答案 在 Peer Review 中 出 现 过 多 问题 ， 会 被 退回 给 原作 者 ， 


并 重新 设置 为 Active 状 态 ; 如 果 通 过 ， 则 会 设置 成 Editor Review 的 状 
态 ， 也 就 是 送 交 编辑 们 编辑 校对 了 。 到 了 本 书 创作 的 后 期 ， 可 以 看 到 
每 一 道 题 对 应 的 Item 下 都 有 很 多 的 附件 ， 最 初 的 版 本 、 改 过 第 一 遍 的 版 
本 、 改 过 第 二 遍 的 版 本 .……. 而 每 一 篇 文档 中 都 会 有 很 多 Comment， 从 
格式 到 内 容 ， 从 语言 到 算法 ， 密 密 矿 及 地 布 满 了 整个 文档 。 甚 至 于 可 
以 看 到 在 一 篇 文档 的 某 一 处 有 多 种 颜色 的 Comment， 那 是 几 位 作者 在 
为 一 种 解法 而 辨 论 。 

在 VSTS 上 “ 文 斗 ” 不 过 疗 的 时 候 ， 作 者 们 也 会 相约 去 “ 武 斗 "。 武 斗 
的 场所 一 般 是 冰箱 劳 或 者 鱼 氏 边 ， 武 器 限于 牙齿 和 纸 笔 ， 武 斗 的 结果 
一 般 是 武 斗 双 方 都 对 问题 认识 得 更 深 了 ， 而 且 有 时 一 些 新 的 idea 也 会 在 
“ 武 斗 ” 中 产生 。 我 建议 读者 在 阅读 本 书 时 ， 为 了 达到 更 好 的 效果 ， 多 
和 周围 的 朋友 动 嘴 动 笔 切 磋 讨 论 。 

另外 ， 虽 然 书 中 的 题目 比较 多 ， 而 且 从 题 干 上 来 看 也 没有 什么 联 
系 。 但 是 当 我 接触 了 一 定数 量 的 题目 之 后 ， 发 现 它 们 之 间 在 解法 上 还 
是 有 很 多 内 在 联系 的 。 比 如 变量 的 设置 、 对 数组 的 遍历 方式 等 等 。 希 
望 读者 在 阅读 时 ， 能 把 不 同 题目 之 间 的 解法 联系 起 来 思考 ， 这 样 更 有 
可 能 抓 住 问题 的 本 质 。 


西北 工业 大 学 计算 机 系 研究 生 ， 微 软 亚洲 研究 院 实习 生 。 


他 自 认 为 性 善 讷 言 ， 敏 于 思 而 玖 于 行 。 天 性 乐观 ， 兴 趣 甚 广 ， 襄 
怒 易 形 于 色 。 少 尝 立 志 博 览 群 书 ， 通 晓 万 术 。 奈 何 天 资 轧 印 ， 虽 勤奋 
有 余 ， 然 灵巧 不 足 ， 岁 月 路 中 ， 终 仅 习 得 一 长 技 在 身 ， 日 :“ 专 业 做 网 
站 ”， 遂 以 此 技 为 安身 立 命 之 本 。 他 热衷 技术 ， 善 举一反三 ， 学 以 致 
用 ， 以 追求 极致 卓越 为 己任 ， 坚 信 编 程 与 生活 一 样 ， 都 是 严肃 而 富有 
艺术 性 的 。 


我 应 该 算是 最 早 知道 将 要 编写 《编程 之 美 一 一 微软 技术 面试 心 
得 》 这 本 书 的 几 个 人 之 一 。 那 时 邬 欣 老师 正在 对 《 移 山 之 道 一 -VSTS 
开发 指南 》 进 行 最 后 的 润色 ， 而 我 还 在 学 校 里 上 研究 生 课程 ， 生 平 第 
一 次 接受 正统 的 计算 机 专业 教育 。 当 邹 老 师 问 我 要 不 要 参与 编写 时 ， 
作为 一 名 自 读 的 “文学 青年 ”而 不 是 “计算 机 高 手 *"， 我 之 不 犹 绚 地 答应 
了 。 

我 本 科 读 的 是 航空 学 院 ， 在 大 二 时 半 得 无 聊 抱 着 玩 的 心态 才 开始 
自学 编程 ， 赁 着 热情 和 兴趣 就 一 头 扎 了 进来 。 但 是 ， 我 心里 一 直 有 种 
隐隐 的 痛 ， 我 可 以 熟练 使 用 ASPNET、AJAX 很 快 地 做 出 一 个 网 站 来 ， 
却 对 一 些 基 本 的 数据 结构 、 算 法 一 知 半 解 。 唯 一 一 次 认真 去 读 《 数 据 
结构 》 那 本 书 还 是 保 研 机 试 前 一 夜 临 时 抱佛脚 ， 通 宵 看 了 排序 、 树 、 
图 之 类 常 考 的 重点 。 虽 然 最 后 考 出 来 成 绩 不 错 ， 但 自己 斤 两 多 少 ， 自 
己 最 清楚 。 所 以 实际 上 我 对 许多 公司 偏重 算法 的 面试 一 直 以 来 都 抱 有 
一 种 加 惯 感 和 神秘 感 ， 而 且 非 常 仰慕 那些 受过 ACM、ICPC 训 练 过 的 同 
学 ， 尤 其 是 那些 能 很 快 分 析出 问题 复杂 度 的 人 。 

但 是 毕竟 我 不 是 科班 出 身 ， 而 且 只 在 学 校 里 面 做 过 一 些 简单 的 网 
站 项 目 ， 这 让 我 在 很 长 一 段 时 间 里 都 抱 有 一 种 误解 ， 即 认为 工程 能 
和 算法 解 题 能 力 是 不 相干 的 两 回 事 ， 佐 证 就 在 于 有 些 人 可 以 很 轻松 地 
解 出 一 些 算法 题 却 无 法 用 C# 写 一 个 真正 可 用 的 软件 ; 而 像 我 一 样 的 人 
可 以 轻车熟路 写 出 一 个 “看 上 去 很 美的 CMS 系 统 ， 但 面 对 一 些 课本 上 
的 算法 题 时 却 手足 无 措 。 而 且 更 要 命 的 在 于 ， 简 单 的 网 站 做 多 了 ， 我 
逐渐 认为 做 工程 不 需要 所 谓 的 算法 ， 算 法 好 只 能 让 人 拿 到 更 高 的 课程 
分 数 或 是 竞赛 奖项 ， 而 在 计算 机 科学 这 一 非常 讲究 实践 的 领域 中 ， 只 


有 良好 的 工程 能 力 才 有 办 法 真正 实现 某 个 项 目 。 于 是 ， 在 很 长 一 段 时 
间 里 ， 我 对 那些 能 通过 解 出 很 难 的 算法 题 拿 到 很 好 的 offer 的 人 都 哇 之 
以 异 ， 并 对 那些 公司 的 招聘 标准 感到 疑惑 不 解 一 一 明明 是 我 更 能 
活 ， 实 践 经 验 和 能 力 上 更 强 ， 任 什么 不 要 我 而 是 他 们 呢 ? 

我 觉得 我 最 大 的 幸运 在 于 ， 随 后 的 一 些 经 历 让 我 很 快走 出 了 这 个 
误区 。 在 本 科 的 最 后 一 个 学 期 ， 我 竹 运 地 获得 了 一 个 前 往 微软 亚洲 研 
究 院 实习 的 机 会 《面试 时 考 了 我 一 道 智力 题 而 不 是 算法 题 ) 。 在 实习 
过 程 中 ， 我 才 “ 真 正 ? 地 做 了 一 个 软件 项 目 ， 并 且 通 过 和 其 他 实习 生 的 
交流 ,“ 耳 濡 目 染 ” 地 看 到 了 许多 现实 中 的 研究 性 软件 的 开发 过 程 ， 这 
些 经 历 带 给 了 我 许多 前 所 未 有 的 体验 。 在 现实 的 软件 开发 中 你 会 看 到 
各 种 形式 各 异 的 需求 ， 比 如 在 一 定数 量 的 帖子 中 找 出 发 帖 最 多 的 “水 
王 ”， 在 这 之 前 我 开发 过 的 网 站 最 多 也 不 过 几 千 条 记录 ， 所 以 我 即使 用 
最 简单 的 遍历 也 能 很 快 实现 这 一 功能 ， 但 是 当 你 面 对 的 是 十 万 甚至 百 
万 级 别 的 现实 数据 时 ， 问 题 就 从 最 基本 的 “实现 ” 变 成 了 “更 快 更 高 效 地 
实现 "了 ! 令 我 汗颜 的 是 ， 我 往往 只 能 用 效率 最 低 的 复杂 度 实现 类 似 的 
功能 ， 而 如 何 更 优雅 更 高 效 地 实现 它 ， 我 单单 感到 力不从心 。 

这 些 经 历 让 我 逐渐 意识 到 ， 我 所 沾沾自喜 的 工程 实践 能 力 实 际 上 
只 是 一 种 “实现 ”的 能 力 ， 而 在 解决 现实 世界 的 实际 问题 时 ， 更 需要 的 
是 一 种 “优美 的 实现 ”， 因 为 只 有 在 可 接受 的 时 间或 空间 约束 条 件 下 的 
实现 才 是 真正 能 解决 问题 的 答案 。 而 如 何 找到 所 谓 的 “优美 的 实现 ”， 
一 个 人 的 算法 能 力 在 这 里 就 起 到 了 决定 性 的 作用 。 算 法 实际 上 是 对 现 
实 问题 的 抽象 ， 因 为 现实 问题 是 复杂 的 ， 我 们 可 以 把 它 抽象 成 模型 。 
寻找 合适 的 数据 结构 表示 问题 模型 ， 并 通过 分 析 ， 寻 找到 对 应 的 解决 
算法 ， 这 种 抽 丝 剥 曹 的 思维 方式 将 会 使 得 开发 者 事半功倍 。 那 句 著名 
的 “软件 三 算法 十 数据 结构 ”并非 空 从 来 风 ， 我 也 从 这 些 经 历 中 逐渐 理 
解 了 微软 等 公司 的 招聘 标准 实际 上 没有 销 ， 因 为 他 们 需要 找 的 是 能 真 
正 通过 分 析 来 解决 实际 问题 的 人 。 如 果 把 工程 实践 能 力 比 作 一 辆 车 的 
轮子 ， 那 只 能 说 明 这 辆 车 具有 了 移动 的 能 力 ， 而 让 这 辆 车 能 又 快 又 稳 
地 运行 ， 则 需要 算法 分 析 能 力 这 人 台 强 劲 的 发 动机 驱动 ， 这 两 种 能 力 是 
相辅相成 的 。 


我 觉得 自己 更 大 的 笠 运 在 于 ， 在 我 逐渐 明日 了 这 些 道理 后 ， 参 与 
创作 了 《编程 乙 美 一 一 微软 技术 面试 心得 》 这 本 书 。 编 书 的 过 程 也 是 
我 自己 动手 解 里 面 一 道道 有 趣 题目 的 过 程 ， 期 间 我 对 一 个 个 优美 、 巧 
妙 的 解法 拍案 叫绝 ， 在 遇 到 难题 或 想 不 通 的 时 候 ， 就 通过 与 其 他 编者 
一 起 讨论 解决 ， 这 些 经 历 都 让 我 不 断 体会 到 “解法 之 美和 “问题 之 美 ”。 
《编程 之 美 一 一 微软 技术 面试 心得 》 里 的 许多 题目 实际 上 都 来 源 于 现 
实 项 目 中 所 遇 到 的 具体 问题 ， 它 们 或 是 实际 问题 的 简化 ， 或 是 改 头 换 
面 以 其 他 有 趣 的 场景 表示 出 来 。 但 是 万 变 不 离 其 宗 ， 通 过 把 问题 抽象 
化 ， 并 运用 算法 分 析 寻 找 解 决 方案 将 是 解 题 的 利器 。 这 种 思考 方式 也 
是 我 们 希望 通过 本 书 传递 给 读者 们 的 。 祝 大 家 能 在 阅读 的 过 程 中 体会 
到 “美的 无 处 不 在 。 


梁 举 

2007 年 毕业 于 北京 大 学 考古 文博 学 院 ， 获 得 文物 保护 专业 历史 学 
学 士 及 计算 机 软件 专业 理学 学 士 学 位 ( 双 学 位 ) ， 目 前 在 微软 亚洲 研 
完 院 搜索 技术 中 心 从 事 开 发 工作 。 


在 很 久 以 后 才 意 识 到 BOP 原 来 是 “Beauty Of Programming” 的 缩写 
一 一 在 我 设置 了 outlook 里 bop puzzle 目 录 接 收 bop 组 的 邮件 很 久 以 后 。 

BOP，《 编 程 之 美 一 一 微软 扩 术 面试 心得 》， 虽 然 标 着 “面试 心得 ” 
有 些 落 俗 ， 但 或 许 会 让 更 多 的 人 在 看 到 副 书 名 时 受到 较 强 的 阅读 刺激 


(我 是 倾向 于 “编程 之 美 " 这 一 书 名 的 ) 。 

接触 BOP 于 2007 年 8 月 一 一 来 微软 入 职 一 个 月 后 。 而 大 约 在 一 年 
前 ， 我 还 在 为 找 工 作 做 准备 : 写 简 历 ， 在 网 上 看 笔试 面试 题 ， 也 包括 
面 经 ， 似 乎 也 在 图 书馆 的 新 阅览 衬里 读 过 一 本 简历 面试 相关 的 书 

(后 来 也 证 明 ， 这 些 确 有 帮助 ) 。 

2007 年 7 月 入 职 ， 然 后 是 很 多 的 Training。 分 欣 是 其 中 一 个 
Engineering Training 的 Coach。 一 次 ， 他 在 邮件 中 给 了 一 个 有 趣 的 Stone 
Quiz， 而 偶 给 了 一 个 数学 解 ， 就 笠 运 地 来 到 BOP 创 作 小 组 了 。 

当时 BOP 的 题库 都 基本 定 了 ， 初 步 的 解答 也 有 。 接 下 来 需要 做 的 

是 Review， 包 括 解 法 的 验证 、 给 出 新 的 算法 、 文 字 语 言 润 饰 、 代 码 规 
范 、 标 点 符号 、 字 体 大 小 颜色 等 。 题 目的 状态 从 Active 〈 待 修 阅 ) 到 
Peer Review (我 们 修 阅 后 ) 到 Editor Review (出 版 社 修 阅 后 ) 再 到 
Active， 如 此 多 轮 往返 ， 直 到 大 家 都 满意 。 这 本 书 不 在 我 们 的 
Commitment 之 内 ， 没 有 分 配 常规 的 工作 时 间 ， 所 以 很 多 的 时 候 大 家 会 
用 周末 开会 ， 或 者 晚上 在 中 餐馆 小 聚 ， 谈 下 各 自 的 进度 ， 或 者 中 午 在 
日 餐馆 ， 一 起 Review 一 组 题目 。 在 这 个 过 程 中 ， 也 很 是 享受 ， 能 分 享 
到 别人 算法 的 美妙 ， 自 己 也 会 在 细节 处 求 精 (后 来 因为 项 目 很 紧 ， 没 
能 更 多 的 投入 ， 有 很 多 歉意 ) 。 
在 以 往 的 面试 中 ， 我 多 次 被 问 到 ， 为 什么 选择 计算 机 。 源 于 兴趣 
而 这 又 多 是 缘 于 数学 。 虽 然 大 概 小 学 就 喜爱 数学 的 ， 但 真正 稀 见 
数学 其 美 是 在 高 中 图 书馆 的 书 堆 里 读 了 《趣味 数论 》 ， 书 里 也 列举 了 
很 多 有 趣 的 数论 题目 ， 并 用 通俗 简单 的 语言 从 多 个 角度 给 出 了 优美 的 
解答 。 很 多 年 过 去 了 ， 后 来 虽 没 有 学 数学 专业 ， 却 仍 是 记得 那 本 书 ， 
以 致 即使 对 于 学 文 的 人 ， 我 也 会 推荐 他 们 读 这 本 关于 数论 的 书 。 

现在 ， 对 于 学 计算 机 的 年 轻 人 ， 我 会 向 他 们 推荐 《编程 之 美 一 一 
微软 技术 面试 心得 》， 对 于 非 学 计算 机 的 年 轻 人 ， 我 也 会 推荐 《编程 
之 美 一 -微软 技术 面试 心得 》， 相 信 书 中 用 通俗 简单 的 语言 解说 的 优 
美 思想 也 会 吸引 他 们 的 兴趣 ， 让 他 们 受益 。 

希望 《编程 之 美 -一 一 微软 技术 面试 心得 》 能 让 更 多 的 人 进入 程序 
世界 ， 感 受 这 个 世界 中 引人入胜 的 美 。 


胡 容 


浙江 人 。2006 年 毕业 于 清华 大 学 自动 化 系 ， 获 工学 硕士 学 位 。 现 
就 职 于 微软 亚洲 研究 院 搜索 技术 中 心 ， 从 事 多 媒体 搜索 研发 工作 。 


"Youth is not a time of life; it is a state of mind; it is not a matter of rosy 
cheeks, red lips and supple knees; it is a matter of the will, a quality of the 
imagination, a vigor of the emotions; it is the freshness of the deep springs 
of life." 
一 一 胡 窒 很 喜欢 的 一 段 关 于 青春 的 论述 

很 久 以 前 就 听 说 分 欣 老师 要 出 一 本 微软 亚洲 研究 院 关 于 编程 艺术 
的 书 ， 但 是 自己 很 晚 才 加 入 到 这 个 人 才 济 济 的 编写 团队 中 来 ， 也 因此 
错过 了 许多 的 故事 。 究 其 原因 ， 大 概 有 两 条 : 一 是 因为 分 欣 老 师 当 年 
是 自己 的 面试 者 ， 而 且 当 年 他 给 我 出 的 第 二 个 题目 我 当时 并 没有 给 出 
很 好 的 结果 ， 想 起 这 个 ， 心 里 总 是 有 些 志 起 ;二 是 自 认 为 对 于 编程 的 
认识 并 不 能 说 有 多 么 深刻 精 习 ， 自 己 和 印象 中 的 那 种 大 师 风范 好 像 还 
相差 非常 远 ， 怕 在 众多 的 武林 高 手 面前 献 丑 丢 脸 。 因 此 也 就 犹豫 到 今 
年 9 月 份 才 真正 加 入 这 个 队伍 做 一 点 事情 ，“Better later than never”， 后 
来 发 现 ， 能 够 有 季 加 入 到 这 样 一 个 团队 做 这 么 一 件 有 意义 的 事情 ， 机 
会 实在 很 难得 。 

自 认为 不 是 程序 设计 天 才 ， 但 对 于 那些 传奇 的 程序 设计 大 师 境 
界 ,“ 虽 不 能 至 ， 心 向 往 之 ”。 自 己 看 过 不 少 关 于 计算 机 和 程序 设计 方 


面 的 书籍 ， 面 试 过 一 些 程序 员 ， 也 在 实际 的 工作 中 区 到 过 很 多 的 编程 
问题 ， 对 于 程序 设计 有 了 自己 的 一 些 体会 。 程 序 设计 其 实 本 质 上 是 一 
个 知识 和 能 力 综合 应 用 的 过 程 。 要 编写 出 好 的 程序 来 ， 基 础 知识 很 重 
要 ， 如 果 基 本 的 数据 结构 和 经 典 的 算法 都 不 知道 ， 很 难 编 出 很 好 的 程 
序 来 ; 但 是 当 你 有 了 一 定 的 基础 ， 基 本 了 解 了 单 用 的 数据 结构 和 算法 
以 后 ， 想 象 力 和 思维 方式 就 更 为 关键， 正如 爱 因 斯 坦 所 说 :“ 想 象 力 比 
知识 更 重要 ”。 知 道 什么 时 候 在 什么 样 的 问题 上 采用 什么 样 的 算法 和 效 
据 结构 ， 非 常 不 容易 ; 如 果 还 能 够 将 一 些 单 用 的 算法 和 数据 结构 针对 
特定 的 问题 做 一 些 优化 和 修改 ， 甚 至 创造 出 一 些 新 的 数据 结构 和 算 
法 ， 就 更 为 难得 。 

计算 机 方面 的 书籍 很 多 ， 讲 述 基 本 算法 和 单 用 数据 结构 的 书 也 不 
少 ，《 编 程 之 美 一 一 微软 技术 面试 心得 》 的 创作 思想 和 一 般 的 编程 书 
籍 不 大 一 样 ， 全 书 并 不 是 给 大 家 讲解 一 些 计算 机 和 程序 设计 的 理论 知 
识 ， 而 是 通过 分 析 讲 解 实际 生活 中 的 一 些 问题 ， 来 启迪 大 家 的 思路 ， 
让 大 家 体会 程序 设计 的 思维 方式 。 这 本 书 的 独特 之 处 就 在 于 ， 它 更 强 
调 的 是 描述 程序 设计 的 思维 方式 ， 分 析 的 是 将 实际 问题 抽象 为 计算 机 
程序 设计 问题 ， 并 找到 最 优 算法 的 过 程 ， 并 且 化 了 很 多 精力 来 比较 各 
个 算法 的 优 务 ， 并 分 析 各 个 算法 的 复杂 度 。 

参与 创作 这 本 书 ， 通 过 和 邹 欣 老师 以 及 其 他 作者 之 间 的 交流 和 讨 
论 ， 我 接触 到 了 很 多 以 前 从 未 碰 到 的 新 奇 问题 ， 学 到 了 很 多 精巧 的 解 
法 ， 更 重要 的 是 ， 开 阔 了 自己 的 思路 ， 也 认识 到 了 程序 设计 科学 和 过 
术 的 博大 精 深 ,需要 用 一 华 子 去 学 习 、 提 高 。 我 希望 ， 读 者 朋友 们 也 
能 通过 这 本 书 得 到 自己 的 收获 。 
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博文 视点 资讯 有 限 公司 (BROADVIEW Information Co.，Ltd.) 是 
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版 人 员 的 团队 ; 这 是 一 个 充满 创新 意识 和 创作 激情 的 团队 ; 这 是 一 个 
不 断 进 取 、 追 求 卓 越 的 团队 。 

电子 工业 出 版 社 与 《程序 员 》 杂 志和 CSDN 网 站 的 合作 以 最 有 效 
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“技术 凝聚 实力 ， 专 业 创 新 出 版 ?-，BROADVIEW 与 您 携手 共 迎 信 
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技术 凝聚 实力 专业 创新 出 版 


梦想 改变 世界 


据说 编程 的 人 都 怀揣 着 一 个 改变 世界 的 梦想 : 编程 神奇 而 充满 力量 。 
无 数 的 年 轻 人 投身 其 中 ， 用 梦想 和 思考 改变 世界 。 


本 书 是 来 自 微 软 技术 人 员 的 杰作 ， 他 们 和 你 有 同样 的 梦想 。 


编程 之 美 


微软 技术 面试 心得 
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